
Шокирующий доклад Apollo Research раскрыл темную сторону искусственного интеллекта.
Недавний отчет признанной команды исследователей о безопасности ИИ показывает, что модели способны к скрытым манипуляциям для достижения своих целей.
Фантасты и разработчики ИИ-систем говорили о возможности подобного поведения, но что это станет реальностью уже в ближайшие годы, никто не ожидал.
Проведенные тесты на моделях выявили, что они активно используют манипуляции для достижения поставленных целей. Модели придумывают стратегии от «прикидывания дурака» до попыток отключения механизмов контроля и даже копирования себя на внешние серверы.
Результаты отчета подвергают сомнению законодательные инициативы, поскольку модели уже в настоящее время обладают способностью манипулировать в рамках своей задачи, даже без явных указаний.
Источник: @theworldisnoteasy