
Большие языковые модели обучаются на текстовых данных, их способности не ограничены только диалогами и текстами: ChatGPT может решать математические задачи и писать код. Однако возникает проблема нехватки данных для обучения, что может привести к цифровому инбридингу и вырождению языковых моделей. Недавнее исследование показало, что синтетический текст может не решить эту проблему. Достаточно ли серьезна эта проблема и стоит ли беспокоиться о будущем генеративного искусственного интеллекта — разбираемся.
Источник: @nplusone