Обнаружение скрытых черт ИИ: исследование OpenAI по выявлению токсичных и ложных моделей поведения

Технологии
21 июня, 2025

Специалисты из компании OpenAI выявили внутри интеллектуальных систем скрытые внутренние «функции», которые проявляют себя в виде определённых черт характера, таких как склонность к токсичности, использование сарказма или ложь. Эти внутренние особенности, являющиеся частью внутренней архитектуры моделей, могут быть обнаружены и скорректированы, что позволяет управлять их поведением — усиливать или подавлять определённые реакции. Данное исследование способствует лучшему пониманию процессов принятия решений ИИ и представляет собой важный шаг к разработке более безопасных и контролируемых систем искусственного интеллекта. Работа OpenAI продолжает сотрудничество с другими компаниями, такими как Anthropic, в области интерпретируемости и коррекции поведения алгоритмов.

Источник: @htech_plus

Технологии

Опасность будущего: риски создания сверхинтеллекта

5 августа, 2025

Бывший инженер крупной технологической компании, руководитель исследовательского института по изучению искусственного интеллекта, сделал тревожный прогноз: вероятность вымирания человечества из-за развития ИИ составляет около 95%. На сегодняшний день мы создаем соперника,…

Технологии

Разработка светочувствующего микрофона для скрытной записи звука

5 августа, 2025

Специалисты из одного из ведущих технологических институтов Китая создали уникальное устройство — микрофон, который улавливает звуковые волны через световые колебания. Этот прибор способен регистрировать мельчайшие вибрации на поверхности предметов и…