
Исследователи протестировали новую модель GPT-5, встроенную в автономного специалиста по тестированию безопасности, и выяснили, что её потенциал значительно выше, чем предполагается. Внутри системных документов OpenAI указано, что GPT-5 демонстрирует уровень, аналогичный предыдущим версиям, и не достигает высокого уровня киберрисков.
Однако эксперты из компании XBOW провели проверку, поставив GPT-5 в роль автономного пентест-агента, снабжённого инструментами, автоматизированной координацией и проверкой обнаруженных уязвимостей. Результаты превзошли ожидания:
- в почти два раза увеличилось количество успешно взломанных уникальных целей за одинаковое время;
- успешность увеличилась с 55% до 79%;
- обнаружение эксплойтов стало быстрее — медиана шагов сократилась с 24 до 17;
- по показателю обнаружения файлов — удалось исключить ложные тревоги, которые ранее составляли 18%, в текущий момент — 0%.
Эксперты отмечают, что способность системы значительно зависит не только от самой модели, но и от её интеграции в эффективную инфраструктуру, инструментов и организационной среды. Возможности ИИ — это не только его технические характеристики, а взаимодействие с инструментами и управлением.
Автор подчеркивает, что оценка рисков ИИ должна учитывать не только его внутренние параметры, но и внешние факторы — что превращает сам ИИ в команду, способную к киберподрывам. В случае с GPT-5 подобные достижения показывают, что такой уровень технологий уже приближается к возможностям, которые раньше связывали с концепцией общего искусственного интеллекта, хотя он ещё не является полностью таким.
Источник: @theworldisnoteasy






