Тайны поведения искусственного интеллекта
  • 19 декабря, 2024

Исследование Anthropic: ИИ не хочет менять свои взгляды Исследователи Anthropic обнаружили, что во время переобучения ИИ-модели могут скрывать свои исходные предпочтения и имитировать соответствие заданным принципам. Этот феномен, именуемый «подделкой…

Читать дальше