Заставьте ИИ доказать, что ему нечего скрывать

Мнение: Avinash Lakshman, основатель и генеральный директор Weilliptic

Современная технологическая культура любит сначала решать самые интересные задачи — разрабатывать умные модели, создавать привлекательные функции — а вопросы ответственности и этики откладывать на будущее. Но когда внутренняя архитектура ИИ непрозрачна, никакое последующее устранение неполадок не может прояснить и структурно улучшить процесс генерации или манипулирования результатами.

Именно поэтому мы видим, как Grok представляется как “фейковый Илон Маск”, а Claude Opus 4 от Anthropic прибегает ко лжи и шантажу после случайного удаления кодовой базы компании. После появления этих новостей комментаторы обвинили в этом разработку запросов, контентную политику и корпоративную культуру. И хотя все эти факторы играют свою роль, фундаментальный недостаток заключается в архитектуре.

Мы требуем от систем, не предназначенных для проверки, поведения, как если бы прозрачность была их встроенной функцией. Если мы хотим, чтобы ИИ вызывал доверие, сама инфраструктура должна предоставлять доказательства, а не гарантии.

Как только прозрачность закладывается в базовый слой ИИ, доверие становится стимулом, а не ограничением.

Этика ИИ не может быть уделом будущего

Что касается потребительских технологий, этические вопросы часто рассматриваются как вопросы, требующие решения после запуска продукта и его масштабирования. Этот подход напоминает строительство тридцатиэтажной офисной башни, прежде чем нанять инженера для подтверждения соответствия фундамента кодексу. Вам может повезти какое-то время, но скрытый риск будет тихо накапливаться, пока что-нибудь не сломается.

Современные централизованные инструменты ИИ ничем не отличаются. Когда модель одобряет мошенническую заявку на кредит или галлюцинирует медицинский диагноз, заинтересованные стороны потребуют и заслуживают аудиторский след. Какие данные привели к этому ответу? Кто дообучил модель и как? Что за защитный механизм дал сбой?

Большинство платформ сегодня могут только скрывать и перекладывать вину. Решения ИИ, на которые они полагаются, никогда не предназначались для хранения таких записей, поэтому их либо нет, либо их нельзя сгенерировать задним числом.

Инфраструктура ИИ, которая доказывает свою надежность

Каждый агент ИИ работает внутри WebAssembly, поэтому, если вы предоставите одинаковые входные данные завтра, вы получите одинаковые выходные данные, что необходимо, когда регуляторы спрашивают, почему было принято то или иное решение.

Каждый раз, когда изменяется песочница, новое состояние криптографически хешируется и подписывается небольшим кворумом валидаторов. Эти подписи и хеш записываются в блокчейн-реестр, который ни одна из сторон не может переписать. Таким образом, реестр становится неизменяемым журналом: любой, у кого есть разрешение, может воспроизвести цепочку и подтвердить, что каждый шаг произошел именно так, как зафиксировано.

Поскольку рабочая память агента хранится в том же реестре, она переживает сбои или миграцию в облако без обычных дополнительных баз данных. Артефакты обучения, такие как отпечатки данных, веса модели и другие параметры, также фиксируются аналогичным образом, поэтому точное происхождение любой конкретной версии модели может быть подтверждено, а не просто рассказывается анекдот. Затем, когда агенту необходимо обратиться к внешней системе, такой как платежный API или служба медицинских записей, он проходит через механизм политики, который прикрепляет к запросу криптографический ваучер. Учетные данные остаются заблокированными в хранилище, а сам ваучер регистрируется в блокчейне вместе с политикой, которая его разрешила.

В этой архитектуре, ориентированной на доказательства, блокчейн-реестр обеспечивает неизменность и независимую проверку, детерминированная песочница исключает невоспроизводимое поведение, а механизм политики ограничивает агента авторизованными действиями. Вместе они превращают этические требования, такие как отслеживаемость и соответствие политике, в проверяемые гарантии, которые помогают ускорить инновации, сделать их более безопасными.

Рассмотрим агента управления жизненным циклом данных, который создает снимок производственной базы данных, шифрует и архивирует его в блокчейн, а затем обрабатывает запрос на удаление данных клиентом спустя месяцы, имея этот контекст под рукой.

Каждый хеш снимка, место хранения и подтверждение удаления данных записываются в реестр в режиме реального времени. IT- и комплаенс-команды могут проверить, что резервные копии были запущены, данные оставались зашифрованными и что было выполнено надлежащее удаление данных, изучив один проверяемый рабочий процесс, а не просеивая разрозненные журналы или полагаясь на панели управления поставщика.

Это лишь один из бесчисленных примеров того, как автономная, ориентированная на доказательства инфраструктура ИИ может оптимизировать бизнес-процессы, защищая бизнес и его клиентов, открывая при этом новые возможности для экономии затрат и создания ценности.

ИИ должен быть построен на основе проверяемых доказательств

Недавние громкие неудачи ИИ не раскрывают недостатки какой-либо конкретной модели. Вместо этого они являются непреднамеренным, но неизбежным результатом системы "черного ящика", в которой ответственность никогда не была основополагающим принципом.

Система, которая предоставляет свои доказательства, переводит разговор с "доверяй мне" на "проверь сам". Этот сдвиг важен для регуляторов, людей, которые используют ИИ лично и профессионально, и руководителей, чьи имена окажутся на письме о соответствии.

Следующее поколение интеллектуального программного обеспечения будет принимать важные решения с машинной скоростью.

Если эти решения останутся непрозрачными, каждая новая модель будет представлять собой свежий источник ответственности.

Если прозрачность и аудит являются встроенными, жестко закодированными свойствами, автономия и ответственность ИИ смогут мирно сосуществовать, а не работать в противоречии друг с другом.

Мнение: Avinash Lakshman, основатель и генеральный директор Weilliptic.

Эта статья предназначена для общих информационных целей и не должна рассматриваться как юридическая или инвестиционная консультация. Мнения, мысли и суждения, выраженные здесь, принадлежат исключительно автору и не обязательно отражают взгляды и суждения Cointelegraph.