Mistral AI 推出 Forge:面向企业的 AI 模型训练平台

Mistral AI lance Forge, plateforme d’entrainement de modèles IA pour les entreprises

Silicon.fr by Philippe Leroy 2026-03-19 16:07 Original
摘要
Mistral AI 在 Nvidia GTC 2026 上发布 Forge,这是一套面向企业的 AI 平台,帮助客户基于自有数据构建、微调和对齐专属模型,覆盖预训练、后训练和强化对齐等完整流程,并支持密集模型、MoE 及多模态输入。该平台采用“agent-first”设计,可由 Mistral Vibe 等自主代理自动执行微调、超参优化和合成数据生成,旨在让企业按现有业务流程定制模型,而非反过来适配通用模型。 Mistral 已与 ASML、爱立信、欧洲航天局、Reply 以及新加坡公共机构等合作,显示其正加速 B2B 战略布局,直接对标 OpenAI 和 Anthropic;同时,Forge 也强化了欧洲企业对数据与模型主权、减少对美国 AI 供应商依赖的诉求。

在企业级 AI 竞争加速之际,Mistral AI 推出 Forge,试图把“通用大模型”真正改造成“企业专用模型”。这项新平台在 Nvidia GTC 2026 上发布,核心目标是让企业基于自有专有数据,构建、训练并持续优化自己的 AI 模型,以强化其 B2B 战略,并正面迎战 OpenAI 和 Anthropic 等对手。

Forge 的出发点很明确:仅靠训练于公开网页数据的通用模型,无法满足大型组织高度场景化、强约束的需求。Mistral 认为,企业真正需要的是能够理解并吸收工程标准、合规政策、代码库、内部运营流程以及历史决策记录的模型,而这些内容通常不在传统训练语料中。Forge 因此覆盖模型全生命周期,包括基于企业私有语料的预训练、面向特定任务的后训练,以及通过强化对齐把内部规则和监管要求纳入模型行为。

平台的设计理念是“让模型适应企业工作流,而不是让企业迁就模型”。这一思路对业务部门和 IT/DSI 部门都具有吸引力:前者希望 AI 更贴近实际业务,后者则更关注可控性、合规性和系统集成。

技术上,Forge 采用“agent-first”定位,不是传统意义上给开发者补充一套工具,而是面向自主 AI 代理来运行。Mistral 举例称,像 Mistral Vibe 这样的代理可以自动发起 fine-tuning、优化超参数、调度训练任务,并生成合成数据来提升测试集表现,整个过程无需持续人工介入。平台还提供现成的“recipes”,用于数据准备和训练流水线,同时负责底层基础设施管理。Mistral 表示,企业甚至可以用自然语言描述个性化需求,由代理将意图自动转化为具体技术操作。

在模型架构支持上,Forge 同时兼容 dense 模型和 Mixture-of-Experts(MoE)架构,便于企业在性能、成本和运维约束之间做权衡;它也支持多模态输入,可覆盖文本、代码及其他类型内容。Forge 与 Mistral 现有模型体系 Small、Medium、Large 相衔接,企业可以直接以这些基础模型为起点,按自身业务环境进行精调。

Mistral 还披露,Forge 已经在与一批重量级客户合作,包括 ASML、Ericsson、欧洲航天局(ESA)、Reply,以及新加坡的公共机构 DSO National Laboratories 和 HTX。客户名单显示,Forge 的目标市场集中在技术密集、监管严格、对模型与数据控制要求极高的行业。

更深层看,Forge 也切中了欧洲企业对数字主权的焦虑。在越来越多欧洲大型企业希望降低对美国 AI 供应商依赖的背景下,Mistral 强调,Forge 允许客户保留模型和数据的完整所有权,这使其不仅是一款训练平台,也是一种面向企业主权与合规需求的战略工具。

Summary
Mistral AI has launched Forge, an enterprise AI platform unveiled at Nvidia GTC 2026 that lets companies build, fine-tune, and align their own models using proprietary data, covering the full lifecycle from pretraining to reinforcement-based compliance tuning. The agent-first platform, powered by autonomous tools like Mistral Vibe and supporting dense, MoE, and multimodal models, is aimed at large organizations such as ASML, Ericsson, and the European Space Agency, strengthening Mistral’s B2B push against OpenAI and Anthropic.

The race to win enterprise AI customers is intensifying, and Mistral AI is taking a new step with Forge, a platform designed to let companies build and fine-tune their own AI models using proprietary data. The launch was announced at Nvidia GTC 2026 and marks a notable move in Mistral’s B2B strategy as it competes with OpenAI and Anthropic.

Forge is aimed at closing a persistent gap between IT departments and business teams. Mistral argues that general-purpose models trained on public web data are not enough for large organizations with highly specific needs. The platform is meant to incorporate engineering standards, compliance policies, codebases, operational processes and internal decision histories—elements typically absent from standard training corpora.

Technically, Forge covers the full model lifecycle: pre-training on proprietary datasets, post-training for specific tasks, and reinforcement-based alignment to internal rules and regulatory constraints. The guiding principle is to adapt models to existing enterprise workflows rather than forcing companies to change how they work, a shift that could appeal to both business leaders and CIOs.

Mistral is also positioning Forge as an “agent-first” platform. Rather than acting as a simple developer tool, it is designed to be operated by autonomous AI agents. An agent such as Mistral Vibe can launch fine-tuning runs, optimize hyperparameters, schedule training jobs and generate synthetic data to improve benchmark performance, with no need for constant human intervention. Forge also includes ready-made “recipes” for data preparation and training pipelines, while handling the underlying infrastructure. Mistral says model customization can even be done in natural language, with the agent translating intent into technical operations.

On the technical side, Forge supports both dense architectures and Mixture-of-Experts (MoE) models, giving enterprises flexibility to balance performance, cost and operational constraints. It also handles multimodal inputs, enabling use cases that combine text, code and other content types. The platform extends Mistral’s existing model lineup—Small, Medium and Large—by using those base models as starting points for adaptation to specific business environments.

Mistral says it is already working with several major customers, including ASML, Ericsson, the European Space Agency, Reply, and Singapore public-sector organizations such as DSO National Laboratories and HTX. Those references underscore Forge’s focus on technologically advanced and heavily regulated sectors, where control over models and data is critical.

Beyond customization, Forge also speaks to a broader sovereignty debate. As major European companies look to reduce dependence on U.S. AI providers, Mistral is emphasizing that enterprises can retain full ownership of both their models and their data.

Résumé
Mistral AI a présenté Forge lors de Nvidia GTC 2026, une plateforme B2B permettant aux entreprises de créer, affiner et aligner leurs propres modèles d’IA à partir de données propriétaires, avec prise en charge du pré-entraînement, du fine-tuning et des architectures denses, MoE et multimodales. La scale-up française, qui cible OpenAI et Anthropic, met en avant une approche « agent-first » pilotée par des agents comme Mistral Vibe et cite déjà ASML, Ericsson, l’ESA ou des organismes publics singapouriens parmi ses clients. L’enjeu est autant technologique que stratégique, avec une promesse de personnalisation profonde, de conformité intégrée et de souveraineté des données pour les grandes entreprises.

La bataille pour conquérir les entreprises s’intensifie dans le secteur de l’IA.

Mistral AI franchit un nouveau cap avec le lancement de Forge, une plateforme destinée à permettre aux entreprises de construire et d’affiner leurs propres modèles d’intelligence artificielle à partir de leurs données propriétaires.

Une annonce faite lors de la conférence Nvidia GTC 2026, qui marque une étape significative dans la stratégie B2B de la scale-up face aux mastodontes OpenAI et Anthropic.

Combler le fossé entre DSI et métiers

Le constat de départ est simple : les modèles généralistes, entraînés sur des données publiques issues du web, ne suffisent pas à répondre aux besoins très contextualisés des grandes organisations.

Forge ambitionne précisément de combler cet écart. La plateforme promet de produire des modèles capables d’intégrer standards d’ingénierie, politiques de conformité, bases de code, processus opérationnels et historiques de décisions internes. Autant d’éléments absents des corpus d’entraînement classiques.

Concrètement, Forge couvre l’ensemble du cycle de vie d’un modèle : pré-entraînement sur des corpus propriétaires, post-entraînement pour des tâches spécifiques, et alignement par renforcement pour intégrer règles internes et contraintes réglementaires.

L’idée directrice est d’adapter les modèles aux workflows existants des entreprises et non l’inverse. Un renversement de perspective qui pourrait séduire les directions métiers autant que les DSI.

Une plateforme pilotée par des agents autonomes

Forge adopte un positionnement « agent-first ». La plateforme n’est pas conçue comme une simple extension d’outils développeurs existants, mais pour être pilotée par des agents d’IA autonomes.

Ainsi, un agent comme Mistral Vibe peut lancer des fine-tunings, optimiser les hyperparamètres, planifier des jobs d’entraînement et générer des données synthétiques pour améliorer les performances sur les jeux de tests. Le tout sans intervention humaine systématique.

Forge propose par ailleurs des « recettes » prêtes à l’emploi pour la préparation de données et des pipelines d’entraînement, tout en gérant l’infrastructure sous-jacente. Mistral affirme que la personnalisation d’un modèle peut se faire en langage naturel, l’agent se chargeant de traduire les intentions en opérations techniques.

Architectures denses, MoE et multimodal

Sur le plan technique, Forge supporte aussi bien les architectures denses que les modèles Mixture-of-Experts (MoE), offrant ainsi la flexibilité nécessaire pour arbitrer entre performance, coûts et contraintes d’exploitation. La plateforme prend également en charge des entrées multimodales, ouvrant la voie à des cas d’usage combinant texte, code et d’autres types de contenus.

Forge s’inscrit dans le prolongement du catalogue de modèles existant de Mistral ( Small, Medium, Large). L’idée est de partir de ces briques pour les affiner selon chaque environnement métier.

Des références industrielles

Mistral indique travailler d’ores et déjà avec plusieurs clients de premier plan : ASML, Ericsson, l’Agence spatiale européenne, Reply, ainsi que des organismes publics singapouriens comme DSO National Laboratories et HTX. Des références qui illustrent le positionnement de Forge sur des secteurs à forte intensité technologique et réglementaire, où la maîtrise des modèles et des données est un enjeu majeur.

Car au-delà de la personnalisation, Forge s’inscrit dans un débat plus large autour de la souveraineté numérique.

Dans un contexte où les grandes entreprises européennes cherchent à réduire leur dépendance vis-à-vis des fournisseurs d’IA américains, Mistral met en avant la possibilité de conserver la pleine propriété de leurs modèles et de leurs données.

The post Mistral AI lance Forge, plateforme d’entrainement de modèles IA pour les entreprises appeared first on Silicon.fr.

AI Insight
Core Point

Mistral AI launched Forge, an enterprise AI model training platform that lets companies build and fine-tune models on proprietary data, strengthening its B2B push and Europe’s AI sovereignty agenda.

Key Players

Mistral AI — AI scale-up, based in Paris, France.

ASML — semiconductor equipment maker, based in Veldhoven, Netherlands.

Ericsson — telecom equipment and software company, based in Stockholm, Sweden.

European Space Agency (ESA) — space agency, based in Paris, France.

Reply — IT consulting and systems integration group, based in Turin, Italy.

DSO National Laboratories — defense R&D organization, based in Singapore.

HTX — public safety and security R&D agency, based in Singapore.

Industry Impact
  • ICT: High — enterprise AI training and deployment for regulated organizations
  • Computing/AI: High — expands model fine-tuning, agentic training, and multimodal AI tooling
  • Automotive: Low — no direct automotive focus, but relevant for industrial AI supply chains
Tracking

Strongly track — this is a strategic enterprise AI platform launch with major implications for competition, sovereign AI, and regulated-industry adoption.

Related Companies
neutral
OpenAI
mature
neutral
Anthropic
startup
neutral
Nvidia
mature
neutral
Mistral AI
startup
positive
ASML
mature
positive
positive
neutral
neutral
Categories
人工智能 软件 云计算
AI Processing
2026-03-26 17:07
openai / gpt-5.4-mini