AI 对抗 AI：在自我加速的威胁循环中保护代码

IA contre IA : sécuriser le code dans un cycle de menaces auto-accéléré

Silicon.fr by Frédéric Malo * 2026-05-27 09:46 Original

摘要
AI正加速代码生成与漏洞扩散，其中Anthropic的Claude Mythos模型可在10至15分钟内、以不到1美元的成本利用已知漏洞，成功率高达72.4%，远超前代模型。这使得传统基于CVSS评分的静态漏洞管理失效，安全行业被迫转向以实际可利用性为核心的动态持续防护，并需将AI物料清单（AI-BOM）等机制融入开发全流程。

人工智能正成为一把双刃剑。它在显著扩大代码攻击面的同时，也彻底重塑了软件开发周期——从代码生成、测试到部署，一切都以空前速度运转。这意味着安全不能再是事后补救，而必须嵌入开发工作流，成为贯穿应用全生命周期的持续机制。

到2026年，这种颠覆已无法回避。AI深度融入开发工具与流程，大幅提升了代码产出，但也让漏洞暴露激增。攻击者利用同样的AI能力，将漏洞利用的速度和规模推至新高：2018年，从漏洞披露到被利用平均需要840天；2026年，这个窗口已缩至1.6天，研究人员预计2028年可能仅需一分钟。更关键的是，以往被认为次要的漏洞，如今可被AI近乎实时地串联成可直接操作的攻击链。Anthropic的模型Claude Mythos便是明证：独立测试显示，它能在10至15分钟内找出已知漏洞并生成功能完备的利用代码，成本不到一美元。其针对已知漏洞的利用成功率达到72.4%，对比之下，Opus 4.6仅为14.4%，Sonnet 4.6为4.4%。一个最初为推理与安全设计的模型，如今却成为最高效的攻击工具之一。

在此背景下，传统漏洞管理基础开始瓦解。过去基于CVSS严重性评分的优先级排序，假设漏洞利用成本高、耗时长且依赖高级技能，但生成式AI已将这一等式打破。仅看利用复杂度、所需权限或影响已不足以反映真实风险。核心变为生产环境中的可利用性：代码中的可达性、实际暴露面以及攻击的自动化潜力。单纯依赖人工团队已难以应对，业界正向“代理式修复”演进，即自动排定优先级并自动修复部分漏洞。安全治理因此从基于严重性的静态模型，转向围绕可操作性风险的动态模型，融合攻击性评分、在拉取请求层面自动打补丁，并将应用安全持续集成进开发周期。

当开发流程本身由AI驱动时，安全防护的边界也必须前移。“左移”成为运营刚需，但需保护的对象已不仅是源代码。AI增强的IDE、自动生成的拉取请求、由AI代理驱动的CI/CD流水线、第三方AI组件，都成为新的暴露面。例如，代理用来连接外部工具的MCP服务器、能在极少人工监督下自主发起PR或触发部署的自治代理，以及某些模型虚构出的依赖项，这些风险对传统源码扫描器几乎是不可见的。因此，一份人工智能物料清单（AI-BOM）变得与软件物料清单同等必要，它需要清晰测绘开发工作流中的所有AI组件，以确保治理、可追溯性，并满足NIST AI RMF框架、欧盟AI法案、ISO 42001以及OWASP LLM Top 10等合规要求。

最终，应用安全必须演变为一种持续化的工业能力，其重心不再是原始告警数量，而是漏洞的真实可利用性。这要求通过上下文分析消除噪声，按可利用性排定风险优先级，在拉取请求层面实现自动化修复，并持续监控整个开发与交付流水线。毕竟，AI无法对自身生成的代码进行有效审计。

Summary
AI is dramatically shortening the exploit window—Anthropic’s Claude Mythos can generate functional exploits for known vulnerabilities in minutes for under a dollar—while simultaneously accelerating code production, forcing a shift from static CVSS-based prioritization to continuous, exploitability-focused security integrated into development workflows. This demands new practices like AI-BOMs and agentic remediation, as traditional scanners fail to cover AI-generated code, IDE agents, and autonomous pipeline components.

Artificial intelligence is now a dual-edged accelerator in software development. It dramatically expands the attack surface by enabling the rapid introduction and propagation of vulnerabilities at scale, while simultaneously transforming development cycles with lightning-fast code generation, testing, and deployment. This pace renders traditional post-hoc security models obsolete; application security must become a continuous mechanism embedded directly into developer workflows across the entire application lifecycle.

By 2026, the disruption is undeniable. Attackers are weaponizing the same AI capabilities to industrialize flaw detection and exploitation. The window between vulnerability disclosure and active exploitation has collapsed from an average of 840 days in 2018 to just 1.6 days in 2026, with researchers projecting it could shrink to one minute by 2028. Vulnerabilities once dismissed as minor can now be woven into operational attack chains by AI almost instantly.

Anthropic’s Claude Mythos model starkly demonstrates this rupture. Independent tests show it can pinpoint known vulnerabilities and generate working exploits in ten to fifteen minutes at a cost of under one dollar, achieving a 72.4% success rate on known flaws. That compares with 14.4% for Opus 4.6 and a mere 4.4% for Sonnet 4.6. A model originally designed for reasoning and security has become one of the most effective offensive tools ever evaluated.

This shift dismantles the CVSS as the sole arbiter of risk. A legacy approach that prioritized based on static severity scores assumed exploitation was slow, costly, and skill-intensive. Today, generative AI analyzes code, identifies attack vectors, and accelerates exploit discovery, making exploitability in production—reachability within running code, real exposure, and automation potential—the decisive metric. Relying on human teams alone for vulnerability management is no longer sufficient. Organizations are moving toward agentic remediation, where systems automatically prioritize and fix flaws, shifting from static severity-based models to dynamic operational exploitability, combining attackability scoring, automated pull-request-level patching, and continuous integration of AppSec into the development cycle.

Security must mirror the agility of AI-boosted development. Embedding it natively at every stage—true "shift left"—is an operational imperative, but the perimeter has expanded beyond first-party code. AI-enriched IDEs, auto-generated pull requests, agent-driven CI/CD pipelines, and third-party AI components introduce fresh exposure. MCP servers that let agents access external tools, autonomous agents that open pull requests or trigger deployments with minimal oversight, and entirely fictitious dependencies hallucinated by models create risks invisible to conventional source-code scanners. An AI Bill of Materials (AI-BOM), mapping every AI component in development workflows, becomes as essential as a software SBOM to ensure governance, traceability, and compliance with frameworks like the NIST AI RMF, EU AI Act, ISO 42001, and OWASP LLM Top 10.

Application security must now be run as a continuous, industrial capability. The focus shifts from raw alert volumes to real exploitability: contextual analysis to reduce noise, prioritization by attackability, automated fixes at the pull-request level, and persistent oversight of development and delivery pipelines. Crucially, AI cannot effectively self-audit the code it produces.

Résumé
L’IA générative, comme le montre le modèle Claude Mythos d’Anthropic capable d’exploiter des failles avec 72,4 % de succès pour moins d’un dollar, accélère à la fois la production de code et l’exploitation des vulnérabilités, réduisant le délai d’attaque à 1,6 jour. Frédéric Malo (Checkmarx) souligne que la sécurité logicielle doit délaisser le score CVSS statique pour une approche dynamique centrée sur l’exploitabilité réelle, intégrée en continu dans les workflows de développement et adossée à un AI-BOM pour cartographier les composants IA. Cette disruption impose une remédiation agentique et une gouvernance alignée sur des cadres comme l’EU AI Act pour contenir une surface d’attaque devenue industrielle.

L’IA agit désormais comme un accélérateur mais à double tranchant.

D’un côté, elle augmente sensiblement la surface d’attaque du code en facilitant l’introduction et la propagation de vulnérabilités à grande échelle. De l’autre, elle transforme radicalement les cycles de développement en fluidifiant la génération de code, les tests et les déploiements à une vitesse inédite.

Cette accélération change la donne. La sécurité logicielle ne peut plus fonctionner selon une logique de correction a posteriori, déconnectée du rythme réel de production mais s’intégrer directement dans les workflows de développement et devenir un mécanisme continu, capable d’accompagner le code tout au long du cycle de vie applicatif.

En 2026, la disruption est impossible à ignorer. L’IA s’est imposée au cœur des outils et des workflows de développement, accélérant considérablement la production de code… mais aussi l’exposition aux vulnérabilités.

Dans le même temps, les attaquants exploitent exactement les mêmes capacités pour détecter et industrialiser l’exploitation des failles à une vitesse inédite. En 2018, il s’écoulait en moyenne 840 jours entre la divulgation d’une vulnérabilité et son exploitation. En 2026, ce délai est tombé à 1,6 jour et les chercheurs projettent même une minute d’ici 2028 !

Le risque a aussi changé d’échelle. Des vulnérabilités autrefois jugées secondaires peuvent désormais être transformées quasi instantanément en chaînes d’attaque opérationnelles générées par IA.

Claude Mythos d’Anthropic illustre cette rupture de manière spectaculaire. Selon des tests indépendants, le modèle serait capable d’identifier des vulnérabilités connues et de générer des exploits fonctionnels en dix à quinze minutes, pour un coût inférieur à un dollar.

Son taux de réussite atteindrait même 72,4 % sur l’exploitation de failles connues, contre 14,4 % pour Opus 4.6 et 4,4 % pour Sonnet 4.6. Un modèle initialement conçu pour le raisonnement et la sécurité figure désormais parmi les outils offensifs les plus efficaces jamais évalués.

Sécurité adaptée à l’IA : la fin du CVSS comme unique arbitre

Une faille non corrigée n’est plus un simple élément de backlog : elle constitue désormais une surface d’attaque potentielle directement exploitable.

Historiquement, la gestion des vulnérabilités reposait sur une logique de priorisation relativement stable, distinguant les failles critiques des failles secondaires. Ce modèle fonctionnait dans un contexte où l’exploitation d’une vulnérabilité restait coûteuse, lente et dépendante de compétences avancées.

Cette équation est désormais fragilisée par les capacités des modèles d’IA générative, capables d’analyser du code, d’identifier des vecteurs d’attaque et d’accélérer fortement la recherche de scénarios d’exploitation. Dans ce cadre, le CVSS, fondé sur la complexité d’exploitation, les privilèges requis ou l’impact, ne suffit plus à refléter le risque réel.

Le point central devient l’exploitabilité en environnement de production, c’est-à-dire la reachability dans le code actif, le niveau d’exposition réel et la capacité d’automatisation de l’attaque. Une gestion des vulnérabilités reposant uniquement sur des équipes humaines est ici limitée et les organisations s’orientent progressivement vers des approches de remédiation agentique, capables de prioriser et de corriger automatiquement certaines failles.

Le pilotage de la sécurité bascule ainsi d’un modèle statique basé sur la sévérité vers un modèle dynamique centré sur l’exploitabilité opérationnelle, combinant scoring d’attaquabilité, automatisation des correctifs au niveau des pull requests et intégration continue de l’AppSec dans le cycle de développement.

Une sécurité « agile » en miroir

Dans un environnement de développement désormais alimenté par l’IA, la sécurité ne peut plus en effet intervenir uniquement en bout de chaîne. Elle doit s’intégrer nativement à chaque étape du cycle applicatif et évoluer au même rythme que les workflows de développement.

Le « shift left » devient ainsi une nécessité opérationnelle. Mais le périmètre à sécuriser dépasse désormais le seul code produit. IDE enrichis par l’IA, pull requests générées automatiquement, pipelines CI/CD pilotés par des agents ou composants IA tiers deviennent autant de nouvelles surfaces d’exposition.

Les serveurs MCP utilisés par les agents pour accéder à des outils externes, les agents autonomes capables d’ouvrir des PR ou de déclencher des déploiements avec peu de supervision humaine, ainsi que les dépendances fictives générées par certains modèles, créent des risques largement invisibles pour des scanners traditionnels conçus pour analyser uniquement le code source.

Dans ce contexte, un AI Bill of Materials (AI-BOM), capable de cartographier l’ensemble des composants IA présents dans les workflows de développement, devient aussi indispensable qu’un SBOM pour les dépendances logicielles classiques. Cette visibilité est essentielle pour assurer gouvernance, traçabilité et conformité avec des référentiels comme le cadre AI RMF du National Institute of Standards and Technology, l’European Union AI Act, l’ISO 42001 ou l’OWASP LLM Top 10.<

La sécurité applicative doit désormais être pilotée comme une capacité industrielle continue, centrée non plus sur le volume brut d’alertes, mais sur l’exploitabilité réelle des vulnérabilités.

Cela implique de réduire le bruit par une analyse contextualisée, de prioriser les risques selon leur capacité d’exploitation, d’automatiser les corrections au niveau des pull requests et d’assurer une supervision continue des pipelines de développement et de livraison. Car une IA ne peut pas s’auto-auditer efficacement sur le code qu’elle produit elle-même.

*Frédéric Malo est Solutions Engineer Professional Lead chez Checkmarx

The post IA contre IA : sécuriser le code dans un cycle de menaces auto-accéléré appeared first on Silicon.fr.

AI Insight

中文 EN

Core Point

AI 既加速代码开发又让攻击者能在几分钟内利用漏洞，迫使软件安全从静态的 CVSS 评分转向持续、基于生产环境可利用性的动态防护。

Key Players

Anthropic — AI 安全公司，总部旧金山，其模型 Claude Mythos 能以低于 1 美元的成本在 15 分钟内生成有效漏洞利用。

Checkmarx — 应用安全测试解决方案提供商，总部以色列，文章作者所属公司。

Industry Impact

ICT: 高 — 开发管道中的 AI 引入新攻击面，安全必须从后置修复转向 CI/CD 原生集成。
Computing/AI: 高 — 攻击性 AI 模型降低利用门槛，同时需通过 AI-BOM 等手段治理 AI 组件风险。

Tracking

Strongly track — 漏洞利用平均时间从 840 天降至 1.6 天，预计 2028 年达分钟级，对所有软件生产构成即时威胁，急需转向基于可利用性的持续安全。

Related Companies

Silicon.fr

mature

neutral

Anthropic

startup

negative

European Union

neutral

OWASP

neutral

Checkmarx

mature

positive

National Institute of Standards and Technology

positive

ISO

neutral

AI Processing

2026-05-27 11:24

deepseek / deepseek-v4-pro