Новая супермодель ИИ от DeepSeek: мощная и доступная

Новая супермодель ИИ от DeepSeek: мощная и доступная

Китайская компания DeepSeek разработала новую огромную модель искусственного интеллекта под названием DeepSeek-V3 с 671 млрд параметров, которая доступна через платформу Hugging Face. Модель использует смешанную архитектуру экспертов и активирует только 37 млрд параметров для решения конкретных задач, обеспечивая высокую точность и эффективность. DeepSeek-V3 превосходит открытые модели, такие как Llama 3.1-405B, и приближается к закрытым решениям Anthropic и OpenAI. Обучение модели обошлось всего в $5,57 млн, что в десятки раз дешевле, чем у конкурентов. Код модели доступен на GitHub под лицензией MIT.

Источник: @htech_plus

Похожие новости

Первая отечественная 5G-антенна показала скорость передачи данных 1 Гбит/с
  • 2 августа, 2025

В Москве прошли испытания первой российской антенны для сетей пятого поколения, разработанной специалистами Московского физико-технического института. Эта 5G-антенна, работавшая в составе полностью отечественного телекоммуникационного оборудования, показала эффективность с передачей данных…

Читать дальше
Технологии контроля личности: от искусственного интеллекта к человеческой психике
  • 2 августа, 2025

В современном мире специалисты достигли значительных успехов в области анализа и регулировки характеристик нейросетей. Так, компании удалось научиться отслеживать и влиять на так называемые «векторы личности», что позволяет в реальном…

Читать дальше