REGALIA:算法监管问题综述

REGALIA, une synthèse des enjeux de régulation des algorithmes

Silicon.fr by Clément Bohic 2026-06-26 13:32 Original
摘要
Inria 在波尔多大学成立了名为 REGALIA 的研究团队,由 Jean-Michel Loubes 和 Benoit Rottembourg 领导,专注于开发算法审计与合规性验证工具,并研究减少训练中产生的偏见、幻觉等不良行为。团队的研究将覆盖图像与文本等多模态通用人工智能的评估,并开发审计工具箱。该项目已与摩洛哥工业集团 OCP 等企业展开合作。

法国国家信息与自动化研究所(Inria)于2025年秋正式组建了REGALIA(人工智能法规)项目团队,落户波尔多大学,由Jean-Michel Loubes和Benoit Rottembourg联合领导。该团队聚焦算法审计与监管,设定两大核心目标:一是开发能够证明算法是否符合既定标准或规范的方法;二是设计使存在不良行为的算法重新变得“公平”的技术手段。REGALIA的研究计划围绕三个轴心展开。

第一轴心着力于“不良行为的测量”,涵盖幻觉、毒性内容以及有害人格模拟等典型问题。团队将分析训练与微调过程中的优化如何转化或放大数据集的固有属性,并探索基于风险画像构建模型-优化器组合,以削弱这些负面效应。同时,他们将开发兼顾模型鲁棒性与分布敏感性的评估指标,并定位算法中的局部漏洞,从而揭示隐藏的决策行为。第二轴心专攻“通用AI的审计”,覆盖图像与文本两大模态。首要任务是梳理现有评估方法并建立分类体系,尤其关注偏见、鲁棒性、安全性与性能等维度;在此基础上,团队将设计新的审计方法与测试基准。第三轴心则致力于“审计指标和技术与社会需求的对齐”,核心是创建一套将抽象要求转化为可辩护声明的翻译机制,明确定义每个指标测量什么、基于哪些假设、在不同场景间如何迁移。预期产出包括“要求-证据”对应矩阵、报告工具包与评估库。团队还将为代理能力、人类监督、合法性及可争议性等关键概念制定可操作的规范目标。最终,所有成果将集成为一个面向算法——甚至可扩展至大系统级别的——审计工具箱。

团队汇集了互补专长的三名研究者。Jean-Michel Loubes此前参与了多项奠基性工作,包括一篇被Benoit Rottembourg在2025年11月NeurIPS会议前着重评论的论文,该文用数学方法证明了标准训练流程如何放大刻板印象;此外还有2025年的《Fairness in the details: Face Dataset Auditing》,提出了一种图像数据集自动审计方案。Benoit Rottembourg则主导了隐私保护非迭代审计方案P2NIA的研究,该方案利用合成数据或本地数据替代API访问,以规避后者的保密、安全及估计偏差等固有缺陷。团队第三名成员、物理学哲学博士Carina Prunkl的知识将有力支撑第三轴心的研究工作。

REGALIA已与Easy Cash合作,评估其电商平台推荐算法的公平性,并为摩洛哥磷酸盐集团OCP执行一项库存分配机制开发任务,该项工作由Inria里尔团队协同推进。Jean-Michel Loubes本人同时担任图卢兹人工智能与自然智能研究所(ANITI)科学委员会成员以及INESIA指导委员会成员。通过这一系列布局,REGALIA旨在架设起技术审计与社会规范之间的桥梁,推动算法监管从原则走向可验证的实践。

Summary
Inria's REGALIA project, led by Jean-Michel Loubes, Benoit Rottembourg, and Carina Prunkl, launched in Bordeaux to develop auditing tools for AI compliance and fairness, targeting issues like bias, hallucinations, and toxicity through a structured three-axis research program. The team collaborates with Easy Cash and Moroccan phosphate giant OCP to evaluate algorithmic fairness and industrial resource allocation, aiming to produce a comprehensive audit toolbox. The initiative reflects growing regulatory pressure, with potential impact on proving algorithmic conformity to emerging standards and operationalizing concepts like human oversight and contestability.

“If minorities matter to you, handle their gradients with care.” That warning, delivered by Benoit Rottembourg in November 2025 as colleagues prepared to present at NeurIPS, captures the spirit of REGALIA (Regulations for Artificial Intelligence), a new Inria project-team officially launched weeks earlier at the University of Bordeaux. Led by Rottembourg and Jean-Michel Loubes, REGALIA aims to build the tools and methods needed to audit algorithms for compliance and correct undesirable behaviors.

The research is structured around three axes. The first, measuring undesirable behaviors, tackles hallucinations, toxicity, and harmful personas, studying how training and fine-tuning amplify such traits and developing model-optimizer pairings tailored to risk profiles. It also involves creating evaluation metrics for model robustness and distribution sensitivity, plus local vulnerability discovery to expose hidden behaviors. The second axis focuses on auditing general-purpose AI (images and text), starting with a taxonomy of existing evaluation methods for bias, robustness, safety, and performance, then designing new techniques and benchmarks. The third axis aligns metrics with societal needs: translating high-level requirements into defensible, explicit statements that clarify what indicators measure and under what assumptions, producing a requirements-evidence matrix, a reporting pack, and an evaluation library. It will also specify normative targets to operationalize concepts like agency, human oversight, legitimacy, and contestability. The ultimate deliverable is an audit toolbox capable of assessing entire systems.

The team combines complementary expertise. Loubes co-authored the NeurIPS paper showing mathematically how standard training amplifies stereotypes, and a 2025 automated method for auditing face datasets. Rottembourg supervised P2NIA, a privacy-preserving auditing scheme that uses synthetic or local data instead of APIs to avoid confidentiality and bias pitfalls. Carina Prunkl, a philosopher of physics, bolsters the third axis. Practical work is already underway: REGALIA analyzed fairness in Easy Cash’s marketplace recommendation algorithm and is assisting Moroccan industrial group OCP on a stock-allocation mechanism with an Inria Lille team. Loubes also sits on the scientific committee of ANITI and the steering committee of INESIA, embedding the project within France’s broader AI governance landscape.

Résumé
L'équipe-projet REGALIA (Regulations for Artificial Intelligence), menée à Inria par Jean-Michel Loubes, Benoit Rottembourg et Carina Prunkl, structure ses recherches autour de l'audit et de la régulation des algorithmes d'IA. Le programme vise à développer des métriques et des outils pour détecter les comportements indésirables, prouver la conformité et renforcer la loyauté des systèmes, avec des applications concrètes pour Easy Cash et le groupe marocain OCP. Les livrables attendus incluent une boîte à outils d'audit et des méthodes pour opérationnaliser des notions comme la supervision humaine et la contestabilité, impactant directement l'écosystème de l'IA générale.

Si les minorités vous importent, prenez des pincettes avec leurs gradients.

En novembre 2025, Benoit Rottembourg avait commenté ainsi les travaux que des collègues s’apprêtaient à présenter à la NeurIPS. Ces travaux s’inscrivaient dans son domaine de spécialisation : l’audit et la régulation des algorithmes. Leur superviseur : Jean-Michel Loubes.

Les deux hommes, travaillant à Inria, collaboraient alors au sein d’une équipe-projet officiellement constituée quelques semaines auparavant : REGALIA (Regulations for Artificial Intelligence). Basée à l’université de Bordeaux, elle a deux grands objectifs. D’une part, développer de quoi prouver la conformité – ou la non-conformité – d’algorithmes à des normes ou à des exigences. De l’autre, concevoir des méthodes pour rendre « loyaux » ceux sujets à des comportements indésirables.

Le programme de recherche se structure en trois axes :

Mesure des comportements indésirables

Audit de l’IA à usage général

Alignement des métriques et des techniques d’audit avec les besoins de la société

Le premier axe englobe des éléments tels que les hallucinations, la toxicité et l’adoption de personnalités nocives. Il s’agit de déterminer comment l’optimisation lors de l’entraînement et du fine-tuning transforme ou amplifie des propriétés du jeu de données. Puis de contribuer à réduire ces effets, en construisant notamment des combinaisons modèle-optimiseur par profil de risque.

En parallèle, REGALIA concevra des métriques d’évaluation, sur deux plans : robustesse des modèles et sensibilité des distributions. Le projet touche aussi à la découverte locale des vulnérabilités des algorithmes, afin de révéler des comportements cachés.

Vers une boîte à outils pour auditer les algorithmes

Le focus sur l’IA à usage général couvrira deux modalités : image et texte. REGALIA a pour premier objectif de créer une taxonomie des méthodes actuelles d’évaluation. En particulier sur les biais, la robustesse, la sûreté et la performance. Il a aussi pour mission d’en concevoir de nouvelles, ainsi que des bancs de test.

Le troisième axe inclut le développement d’une méthode pour traduire des exigences en déclarations défendables. En d’autres termes, pour rendre l’évaluation explicite : que mesure tel indicateur ? sur la base de quelles suppositions ? avec quelle portabilité entre contextes ?… Livrables attendus : une matrice de correspondance exigences-preuves, un pack de reporting et une bibliothèque d’évaluation.

En complément, REGALIA spécifiera des cibles normatives. De ces travaux découleront des méthodes destinées à opérationnaliser des notions telles que la capacité d’action (agency), la supervision humaine, la légitimité et la contestabilité.

Au bout de la chaîne, un livrable attendu : une boîte à outils pour l’audit d’algorithmes… y compris à l’échelle de systèmes.

Trois chercheurs, trois expertises complémentaires

REGALIA peut s’appuyer sur des travaux antérieurs auxquels a contribué Jean-Michel Loubes. Parmi eux, l’article susmentionné qui aborde la question des minorités. Il démontre plus précisément, par la voie mathématique, comment l’entraînement standard amplifie les stéréotypes. On peut aussi citer « Fairness in the details: Face Dataset Auditing » (2025), qui propose une méthode automatisée d’audit de jeux de données d’images.

Benoit Rottembourg a quant à lui supervisé, entre autres, les travaux sur P2NIA (Privacy-Preserving Non-Iterative Auditing). Il s’agit d’un schéma d’audit alternatif qui utilise des données synthétiques ou locales plutôt que des API, afin d’éviter les défis inhérents à ces dernières (confidentialité, sécurité, biais d’estimation).

Dans l’équipe-projet, il y a aussi Carina Prunkl. Les travaux précédents de cette docteure en philosophie de la physique alimenteront le troisième axe du programme de REGALIA.

Un projet avec un groupe industriel marocain

REGALIA a collaboré avec Easy Cash pour évaluer l’équité de l’algo de recommandation sur sa marketplace. Il mène aussi une mission pour le groupe industriel marocain OCP (extraction, transformation et commercialisation du phosphate), en partenariat avec une équipe Inria de Lille, pour développer un mécanisme d’allocation de stocks.

Jean-Michel Loubes est aussi membre du comité scientifique d’ANITI (Artificial ans Natural Intelligence Toulouse Institute) et du comité de direction de l’INESIA.

À consulter en complément :

L’INESIA a sa feuille de route… et son défi de coopération

CNIL et Inria renforcent leur coopération

Stratégie IA : la France en tête du peloton européen… mais loin du compte

Bercy crée une Direction de l’IA et du numérique

L’IA industrielle finalement (quasi) exemptée d’AI Act

Illustration générée par IA

The post REGALIA, une synthèse des enjeux de régulation des algorithmes appeared first on Silicon.fr.

AI Insight
核心要点

法国INRIA成立REGALIA团队,专注算法审计与规制,旨在开发工具证明AI合规性并纠正有害行为,此举回应全球AI监管需求。

关键参与者
  • INRIA REGALIA团队 — 法国国家数字科技研究所下属团队,位于波尔多大学,专攻算法审计与公平性。
  • Jean-Michel Loubes — REGALIA负责人,Inria研究员,专注算法偏见与审计。
  • Benoit Rottembourg — 团队成员,研究隐私保护审计方案。
  • Carina Prunkl — 团队成员,哲学家,主导将社会需求转化为可审计指标。
  • OCP集团 — 摩洛哥磷酸盐工业集团,与REGALIA合作开发库存分配机制。
行业影响
  • 计算/AI: 高 — 提供通用AI审计工具和毒性、幻觉等指标的度量框架,直接影响大模型合规路径。
  • ICT: 中 — 为数字服务算法问责提供方法论,可能成为监管科技供应商。
追踪建议

强烈追踪 — REGALIA的工作直接对接AI Act等法规,其产出或将成为欧盟算法审计的事实标准。

Highlights
Local Research
Related Companies

No companies linked yet

Categories
人工智能 软件 科研
AI Processing
2026-06-26 15:40
deepseek / deepseek-v4-pro