Новая супермодель ИИ от DeepSeek: мощная и доступная

Новая супермодель ИИ от DeepSeek: мощная и доступная

Китайская компания DeepSeek разработала новую огромную модель искусственного интеллекта под названием DeepSeek-V3 с 671 млрд параметров, которая доступна через платформу Hugging Face. Модель использует смешанную архитектуру экспертов и активирует только 37 млрд параметров для решения конкретных задач, обеспечивая высокую точность и эффективность. DeepSeek-V3 превосходит открытые модели, такие как Llama 3.1-405B, и приближается к закрытым решениям Anthropic и OpenAI. Обучение модели обошлось всего в $5,57 млн, что в десятки раз дешевле, чем у конкурентов. Код модели доступен на GitHub под лицензией MIT.

Источник: @htech_plus

Похожие новости

Новое защитное покрытие повышает устойчивость металла к коррозии
  • 18 июня, 2025

Современная инфраструктура, такая как небоскрёбы и мосты, основана на использовании железа, однако один из главных её врагов – ржавчина – значительно снижает его прочность и вызывает большие расходы на ремонт.…

Читать дальше
От космических исследований к повседневным технологиям: история камер смартфонов
  • 1 июня, 2025

Изначально созданные для целей исследования космоса, современные камеры на смартфонах используют технологии, разработанные в рамках межпланетных миссий. Основатель NASA Эрик Фоссум занимался вопросом миниатюризации камер для космических приборов, в результате…

Читать дальше