Новая супермодель ИИ от DeepSeek: мощная и доступная

Новая супермодель ИИ от DeepSeek: мощная и доступная

Китайская компания DeepSeek разработала новую огромную модель искусственного интеллекта под названием DeepSeek-V3 с 671 млрд параметров, которая доступна через платформу Hugging Face. Модель использует смешанную архитектуру экспертов и активирует только 37 млрд параметров для решения конкретных задач, обеспечивая высокую точность и эффективность. DeepSeek-V3 превосходит открытые модели, такие как Llama 3.1-405B, и приближается к закрытым решениям Anthropic и OpenAI. Обучение модели обошлось всего в $5,57 млн, что в десятки раз дешевле, чем у конкурентов. Код модели доступен на GitHub под лицензией MIT.

Источник: @htech_plus

Похожие новости

Инновационный нейрочип помогает пациенту с БАС управлять камерой и восстанавливать автономию
  • 15 ноября, 2025

Нейрочип позволил человеку с боковым амиотрофическим склерозом снова ориентироваться в пространстве и взаимодействовать с окружающими. Пациент, страдающий БАС, использует нейроимплант от компании Neuralink для управления камерой и восприятия окружающей обстановки.…

Читать дальше
OpenAI расширила возможности ChatGPT: теперь у него восемь новых «личностей»
  • 14 ноября, 2025

Компания OpenAI представила обновленные версии своих языковых моделей — GPT-5.1 Instant и GPT-5.1 Thinking, которые уже доступны для использования в ChatGPT. Производитель отмечает, что новые модели стали быстрее, точнее и…

Читать дальше