Новая супермодель ИИ от DeepSeek: мощная и доступная

Новая супермодель ИИ от DeepSeek: мощная и доступная

Китайская компания DeepSeek разработала новую огромную модель искусственного интеллекта под названием DeepSeek-V3 с 671 млрд параметров, которая доступна через платформу Hugging Face. Модель использует смешанную архитектуру экспертов и активирует только 37 млрд параметров для решения конкретных задач, обеспечивая высокую точность и эффективность. DeepSeek-V3 превосходит открытые модели, такие как Llama 3.1-405B, и приближается к закрытым решениям Anthropic и OpenAI. Обучение модели обошлось всего в $5,57 млн, что в десятки раз дешевле, чем у конкурентов. Код модели доступен на GitHub под лицензией MIT.

Источник: @htech_plus

Похожие новости

Опасность будущего: риски создания сверхинтеллекта
  • 5 августа, 2025

Бывший инженер крупной технологической компании, руководитель исследовательского института по изучению искусственного интеллекта, сделал тревожный прогноз: вероятность вымирания человечества из-за развития ИИ составляет около 95%. На сегодняшний день мы создаем соперника,…

Читать дальше
Разработка светочувствующего микрофона для скрытной записи звука
  • 5 августа, 2025

Специалисты из одного из ведущих технологических институтов Китая создали уникальное устройство — микрофон, который улавливает звуковые волны через световые колебания. Этот прибор способен регистрировать мельчайшие вибрации на поверхности предметов и…

Читать дальше