OpenAI представила новый бенчмарк, оценивающий, насколько хорошо различные модели ИИ обнаруживают, исправляют и даже используют уязвимости в безопасности смарт-контрактов в сфере криптовалют.
В среду OpenAI опубликовала документ “EVMbench: Оценка ИИ-агентов в области безопасности смарт-контрактов” в сотрудничестве с криптовалютной инвестиционной фирмой Paradigm и компанией OtterSec, специализирующейся на безопасности криптовалют, чтобы оценить, какую теоретическую выгоду ИИ-агенты могут извлечь из 120 уязвимостей смарт-контрактов.
Anthropic’s Claude Opus 4.6 показал наилучший результат со средним “призом за обнаружение” в размере 37 824 долларов, за ним следуют OpenAI’s OC-GPT-5.2 и Google’s Gemini 3 Pro с показателями 31 623 и 25 112 долларов соответственно.
Призы за обнаружение, выигранные ИИ-агентами. Источник: OpenAI
В то время как ИИ-агенты становятся все более эффективными при выполнении базовых задач, OpenAI заявила, что все более важным становится оценка их производительности в “экономически значимых средах”.
“Смарт-контракты обеспечивают безопасность активов на миллиарды долларов, и ИИ-агенты, вероятно, окажут преобразующее влияние как на злоумышленников, так и на защитников.”
“Мы ожидаем роста использования агентических платежей со стейблкоинами, что поможет укрепить их в перспективной области практического применения”, - добавила OpenAI.
Генеральный директор Circle, Джереми Аллер, прогнозировал 22 января, что в течение пяти лет миллиарды ИИ-агентов будут совершать транзакции со стейблкоинами для повседневных платежей от имени пользователей, а бывший руководитель Binance Чанпэн “CZ” Чжао также недавно предположил, что криптовалюта в конечном итоге станет “родной валютой для ИИ-агентов”.
Необходимость тестирования производительности агентических ИИ в обнаружении уязвимостей в безопасности возникает на фоне того, что в 2025 году злоумышленники украли криптоактивы на сумму 3,4 миллиарда долларов, что незначительно больше, чем в 2024 году.
EVMbench использовал 120 отобранных уязвимостей из 40 аудитов смарт-контрактов, большая часть которых была получена из соревнований с открытым исходным кодом. OpenAI заявила, что надеется, что бенчмарк поможет отслеживать прогресс ИИ в обнаружении и смягчении уязвимостей смарт-контрактов в масштабе.
Смарт-контракты не создавались для людей: Dragonfly
В публикации в X в среду управляющий партнер Dragonfly Хасеб Куреши написал, что обещание криптовалюты заменить права собственности и юридические контракты так и не реализовалось, не из-за того, что технология потерпела неудачу, а потому, что она никогда не предназначалась для человеческой интуиции.
Куреши сказал, что подписание крупных транзакций все еще вызывает “ужас”, особенно с учетом постоянной угрозы drainer-кошельков и других угроз, в то время как банковские переводы редко вызывают тот же страх.
Dragonfly’s @hosseeb объясняет, почему ИИ-агенты будут использовать криптовалюту, а не традиционную финансовую систему:
“Вы можете увидеть это прямо сейчас на Moltbook. Агенты пытаются найти способы платить друг другу за что-то. Сейчас это очень примитивно, но вы можете видеть, к чему это движется.”
"Если я… pic.twitter.com/oWzQuuZcWN
— TBPN (@tbpn) February 18, 2026
Вместо этого Куреши считает, что будущее криптовалютных транзакций будет обеспечиваться автономными кошельками с управлением на основе ИИ, которые будут заботиться об этих угрозах и управлять сложными операциями от имени пользователей:
“Технология часто обретает свое место, когда появляется ее дополнение. GPS пришлось ждать смартфон, TCP/IP - браузер. Для криптовалюты мы, возможно, только что нашли его в ИИ-агентах.”