Правительственный координационный центр по кибербезопасности (GC3) — партнерство между NCSC и Министерством науки, инноваций и технологий

Правительственный план действий в области кибербезопасности направлен на повышение киберустойчивости государственного сектора Великобритании за счет использования новых технологий для управления рисками. Правительственный координационный центр по кибербезопасности (GC3) — партнерство между NCSC и Министерством науки, инноваций и технологий — возглавляет эту работу, изучая, как передовые технологии искусственного интеллекта могут безопасно применяться для киберзащиты в государственном секторе.

Правительственный план действий в области кибербезопасности направлен на повышение киберустойчивости государственного сектора Великобритании за счет использования новых технологий для управления рисками. Правительственный координационный центр по кибербезопасности (GC3) — партнерство между NCSC и Министерством науки, инноваций и технологий — возглавляет эту работу, изучая, как передовые технологии искусственного интеллекта могут безопасно применяться для киберзащиты в государственном секторе.

От:: Департамент науки, инноваций и технологий и Национальный центр кибербезопасности
Опубликовано: 12 июня 2026 г.

От передовых моделей до влияния на практике

Мы знаем, что ИИ меняет ландшафт киберугроз. Недавно выпущенные передовые системы ИИ, такие как Claude Mythos и GPT-5.5, произвели качественный скачок в развитии кибервозможностей, а оценки Института безопасности ИИ Великобритании (AISI) показывают, что эти модели очень быстро улучшают свои навыки в решении киберзадач.

Однако оценка в синтетических средах дает лишь ограниченное представление о реальном использовании. Высокий балл в бенчмарке не обязательно означает обнаружение и устранение реальных уязвимостей.

Что мы сделали

Правительственный центр киберкоординации проводил еженедельные очные хакатоны, в которых использовался передовой искусственный интеллект для сканирования общедоступных репозиториев кода в государственных учреждениях. Работая в тесном сотрудничестве со специалистами из AISI и NCSC, мы ставили перед собой цель выявлять и устранять ранее неизвестные уязвимости до того, как их можно будет использовать. Вместо того чтобы навязывать единый подход, мы предоставляли командам доступ к моделям и позволяли им создавать собственные инструменты, отмечая, что работает каждую неделю, и развивая лучшие подходы.

Правительство Великобритании поощряет открытый доступ к исходному коду по умолчанию, за исключением случаев, когда это оправдано и обосновано. На практике это создает определенную степень общей прозрачности, которую могут использовать злоумышленники. Однако такая открытость также ограничивает дублирование кода и приводит к созданию более чистого и легко поддерживаемого кода.

Опубликованный в открытом доступе код уже прошел тщательную предварительную проверку, что означает, что его можно передавать поставщикам передовых моделей с минимальным дополнительным контролем. Это значит, что государственные ведомства могут быстро и уверенно внедрять новые возможности.

Цепочка состязаний, бросающая вызов самой себе. Одна команда пропустила каждый публичный репозиторий через шестиэтапный конвейер обработки данных с помощью ИИ-агента: сортировка, валидация, аудит, трассировка, оценка, подведение итогов. На каждом этапе анализируется и проверяется предыдущий. В одном случае агент понизил оценку обнаруженной уязвимости, как только установил наличие резервного механизма. Конвейер был агентным, но эскалация происходила вручную. Это означает, что член команды проверял каждую строку, повторно подтверждал наличие уязвимости и обрабатывал ложные срабатывания.

Детерминированные сканеры, подающие данные в модель. Другая команда сначала запустила традиционные инструменты сканирования (включая Gitleaks, Trivy, Semgrep и Hadolint), чтобы сгенерировать документ с ранжированными результатами. Затем поверх этого были наложены три этапа моделирования: этап обнаружения, на котором результаты сканирования рассматривались как зацепки, а исходный код считывался в соответствии с фреймворками OWASP и CWE; этап исследования цепочки, на котором отдельные результаты объединялись в пути атаки с помощью суб-агентов для каждой цепочки; и этап сортировки, на котором подтверждалась жизнеспособность результатов.

Кодификация аудита нескольких сервисов в многократно используемые навыки. Другой отдел разработал пять предметно-ориентированных навыков Клода. Эти навыки позволяют преобразовать аудит в масштабах всей организации, охватывающий сотни сервисов, в нечто повторяемое. Навыки обеспечили многократно используемый, структурированный и согласованный подход для каждого репозитория и оператора.

Что мы обнаружили

Участники выявили в общей сложности 407 уязвимостей, включая критические недостатки, позволяющие обходить аутентификацию, раскрывать данные и осуществлять удаленное выполнение кода. Некоторые из них уже были известны и устранены с помощью компенсирующих мер контроля, в то время как другие были ранее неизвестны. Все критические недостатки были устранены, и никаких признаков эксплуатации выявлено не было.

Модели искусственного интеллекта отслеживали уязвимости на разных уровнях сервисов, чего не могут сделать традиционные сканеры, и связывали бизнес-логику с техническими деталями. Ведомства уделяли приоритетное внимание проверке и устранению уязвимостей с помощью существующих механизмов, исправляя критические и высокорискованные проблемы, которые были оценены как потенциально уязвимые.

На выявление этих уязвимостей нам потребовалось 13 000 фунтов стерлингов в виде жетонов, и в течение месяца мы работали с девятью государственными организациями.

Выявление критических уязвимостей: Одна из заметных уязвимостей затронула устаревшие функции GitHub Actions в репозитории, поддерживающем ключевой государственный цифровой сервис. Проблема позволяла внешнему пользователю запускать цепочку рабочих процессов, оставляя специально структурированный комментарий к открытому запросу на слияние. Это обходило обычную защиту запросов на слияние от неизвестных участников, поскольку рабочий процесс запускался комментарием, а не самим запросом на слияние.

Последствия заключались в произвольном удаленном выполнении кода на раннере GitHub Actions. Рабочий процесс брал содержимое комментария, передавал его в параметры развертывания и использовал на этапе подстановки среды, который выполнялся во время рабочего процесса. Разместив исполняемое содержимое в поле комментария, внешний пользователь мог запустить свой ввод на раннере GitHub.

Это создало возможность для злоумышленников потенциально извлечь секреты и токены, доступные рабочему процессу, включая токен GitHub, используемый автоматизацией. При таком уровне доступа уязвимость может способствовать более масштабному взлому репозитория, включая манипулирование запросами на слияние, утверждение действий в рабочем процессе, изменение статуса доверенного участника и использование дополнительных секретов, доступных среде автоматизации.

Что мы узнали

Общим знаменателем для всех команд была структура. Модели использовались в качестве компонентов, с применением навыков, работали параллельно в разных репозиториях, а эксперт был в курсе всего, что имело значение. Мы узнали, что:

Архитектура имеет первостепенное значение. Наилучшие результаты были достигнуты при использовании моделей границ возможностей в качестве узкоспециализированных компонентов внутри структурированного конвейера. Разделение традиционных рабочих процессов управления уязвимостями на отдельные, специфичные для каждой задачи инструменты позволило командам масштабироваться, одновременно контролируя ложные срабатывания и иллюзорность.
Сама модель имеет меньшее значение, чем способ её использования. Исследование AISI, подтверждённое здесь, показывает, что при правильной архитектуре и проектировании задач многие модели, находящиеся на стыке передовых и передовых технологий, демонстрируют сопоставимые результаты при сканировании кода. Лучшие результаты по-прежнему в значительной степени опираются на экспертные знания человека в разбивке проблемы на части и определении более широкого контекста.
Первичная оценка (триаж) крайне важна. Агенты генерируют потенциальные результаты гораздо быстрее, чем люди могут их проверить. Нечетко спланированные проверки расходуют ресурсы на малоценные цели; слабая проверка перекладывает нагрузку на перегруженные команды безопасности. Тщательное предварительное определение масштаба и структурированная внутренняя фильтрация результатов с низкой степенью достоверности позволили сосредоточить внимание на проверке со стороны людей. Как и в традиционном управлении уязвимостями, важно не количество обнаруженных проблем, а то, насколько эффективно первичная оценка направляет ограниченные ресурсы туда, где это действительно необходимо.
Выявление проблем — это не то же самое, что их устранение. Выявленные проблемы все равно должны были попасть в конвейер обработки патчей для исправления. Искусственный интеллект здесь тоже подает большие надежды, но сегодня приоритизация, анализ и создание патчей должны быть интегрированы, не перегружая при этом процессы, ориентированные на человека.

Что дальше

GC3 запустит второй этап этого пилотного проекта с участием большего числа ведомств, дополнительных моделей и расширением охвата с общедоступного кода на закрытые системы. Выявление уязвимостей на ранних стадиях, повышение согласованности методов защиты и помощь ведомствам в обмене проверенными методами — вот как мы реализуем правительственный план действий в области кибербезопасности .

Участие AISI и NCSC также будет углубляться по мере того, как мы будем продолжать оценивать ИИ как инструмент киберзащиты в прикладных условиях, сокращая разрыв между теоретическим эталоном и реальным снижением риска.

Этот пилотный проект был проверкой того, как правительство может ответственно внедрять новые возможности, быстро учиться и делиться тем, что работает.

Правительственный координационный центр по кибербезопасности (GC3) — партнерство между NCSC и Министерством науки, инноваций и технологий

Когда ИИ покидает лабораторию: тестирование передовых моделей в сфере киберзащиты государственных структур

От передовых моделей до влияния на практике

Что мы сделали

Что мы обнаружили

Что мы узнали

Что дальше

О нас

NOTA BENE