在超大规模厂商之间，智能体堆栈层出不穷……却又如此相似？

Entre hyperscalers, les stacks agentiques se suivent… et se ressemblent ?

Silicon.fr by Clément Bohic 2026-06-05 10:51 Original

摘要
在2026年谷歌云巴黎峰会上，三大美国云厂商的智能代理栈在基础设施与MCP标准上渐趋同，但在自有模型实力（谷歌Gemini多模态领先，AWS被视作LLM中介）与目标市场（AWS偏B2B，微软和谷歌偏B2C）上仍存分歧，而阿里云因快速采用OpenClaw/Hermes亦被提及。Doctolib副总裁Nacim Rahal指出代理范式正打破传统系统职责分离，RATP Dev总裁Hiba Farès透露其逾千员工已迁移至Gemini Enterprise，但此前面临影子AI带来的数据外泄风险。

在超大规模云厂商构建智能体技术栈的浪潮中，AWS、微软与Google Cloud三家美国巨头看似路径趋同，但背后仍存关键差异，而阿里云与英伟达也在特定领域加速布局。

模型自主与数据策略的鲜明分野

Google Cloud对自家模型的掌控力最为突出。在巴黎的Google Cloud Summit上，Gemini Enterprise Agent Platform（实质为Vertex AI的品牌重塑）成为焦点，开场演讲几乎仅围绕Gemini系列展开。该系列明确走向“四模态”（文本、图像、音频、视频），新近推出Gemini Omni和Gemma 4，且被Gartner评为多模态领域领导者。AWS虽有自研模型Nova，但市场仍将其视作大语言模型的“经纪人”，对其自研能力态度谨慎。微软则因与OpenAI的深度绑定，自研模型起步较晚，至今未能规模化。

数据层面，微软的基础设施常被视为更“孤岛化”，碎片化程度高于Google Cloud和AWS；AWS则秉持“以你现有姿态接入”的开放态度。不过前两家也在逐步走向开放。

基础设施趋同，行业标准影响有限

在基础设施方面，业界普遍认为已趋同，甚至出现“商品化”迹象，例如成本可忽略的分块SaaS，以及tokenizer的标准化有利于RAG的可移植性。安全性、权限管理、评估等工业化必需要素也趋于对等，行业标准如模型上下文协议（MCP）正发挥推动作用。但MCP并非放之四海而皆准，Google Cloud在将其服务“MCP化”的同时，也提供Workspace CLI、Antigravity CLI等其他交互方式。

这种基础设施的趋同带来的一个现实优势是，大模型在云平台上的运行性价比可能超过AI实验室自建的服务器。例如有谷歌云合作伙伴证实，Claude在GCP上的成本性能比优于在Anthropic自家服务器。

智能体推动力一致，客群基因各有侧重

客户与合作伙伴普遍认为，三家巨头在推动智能体AI的整体思路上趋于一致，但历史基因带来不同侧重：AWS仍扎根B2B，是唯一能宣称有大型机现代化改造真实案例的厂商；微软和Google则偏重B2C，Google还被认为心态更“开放”——这也导致其产品更容易被放弃，例如Veolia曾因Google Cloud Print突然停运而大受冲击，因其当时已将设备标准化为Chromebook。

Google Cloud团队在回应差异问题时，首先强调集团在基础研究上的积淀，最典型的是DeepMind贡献了奠基性论文《Attention is All You Need》，以及开放模型AlphaFold（从氨基酸序列预测蛋白质结构）。

组织边界被打破，落地加速

智能体范式正在打破系统开发中的职责分离原则。Doctolib数据与AI副总裁Nacim Rahal指出，一个智能体可同时影响系统本身和组织设计，产品经理可能直接修改提示词，数据工程师、机器学习工程师与软件工程师将在同类任务上协同工作。

企业采纳也在提速。RATP Dev公司25000名员工中已有超1000人迁移至Gemini Enterprise。其董事会主席Hiba Farès透露，公司从2023年试验，到2025年末才真正规模化推进，因为那时看到了真正的投资回报率用例，并发现公司数据通过影子AI过度外流（每个员工约50次请求）。而关键破局点在于让拥有业务实权的高管团队亲自到谷歌接受培训，同时50名非IT出身的“冠军”志愿者成为基层信息采集者，推动了日常需求与痛点的收集。

Summary
Google Cloud unveiled its multimodal Gemini Enterprise Agent Platform at its 2026 Paris summit, while AWS and Microsoft lag in first-party models and data integration, and Alibaba Cloud gains notice for swiftly implementing open agentic stacks with NVIDIA. RATP Dev’s deployment to over 1,000 employees and Doctolib’s organizational shifts illustrate how agentic AI convergence among hyperscalers is reshaping enterprise roles but also surfacing data sovereignty and tool-abandonment risks.

The race to build agentic AI stacks among the major cloud providers is raising questions of convergence versus divergence. While AWS, Microsoft, and Google Cloud dominate the conversation, Alibaba Cloud has emerged as a fast mover with its sandboxed implementation of OpenClaw/Hermes, and NVIDIA is also in the mix with its OpenShell initiative. At the Google Cloud Summit Paris 2026, attended by some 3,600 participants, the clear message was that Google Cloud has an edge in first-party model maturity. Its rebranded Gemini Enterprise Agent Platform—previously Vertex AI—showcases a family of large language models increasingly oriented toward “quadrimodality” (text, image, audio, video), with Gemini Omni and Gemma 4 as the latest examples. Gartner recently named Google a leader in multimodality. In contrast, AWS’s Nova models are viewed more cautiously, and the market still sees Amazon as primarily an LLM broker. Microsoft, constrained by its deep OpenAI partnership, was late to diversify and its first-party models have yet to scale.

On the data layer, Microsoft Foundry is perceived as more fragmented or siloed than the stacks of Google Cloud and AWS. AWS takes a more agnostic “come as you are” approach, though the others are gradually opening up. Infrastructure is widely seen as converging toward commoditization, with low-cost chunking SaaS and normalized tokenizers improving RAG portability. Industry standards like Model Context Protocol (MCP) contribute to parity in industrialization needs—security, permissions, evaluation—even if MCP isn’t always ideal for API exposure. Google Cloud has “MCP-ized” its services but also provides alternative paths like Workspace CLI and Antigravity CLI. While infrastructure isn’t a major differentiator between clouds, it gives them a leg up over AI labs: a Google Cloud partner noted that Claude performs better and costs less on GCP than on Anthropic’s own servers.

Market focus reveals divergence. AWS remains firmly B2B, with tangible use cases such as mainframe modernization. Microsoft leans B2C, as does Google Cloud, though Google’s “open” mindset sometimes leads to abrupt product shutdowns—Veolia was caught off-guard by the end of Google Cloud Print after standardizing on Chromebooks. Google Cloud teams emphasize their fundamental research legacy, citing DeepMind’s contributions like the “Attention is All You Need” paper and the open-source AlphaFold protein-structure prediction model.

The rise of agentic AI is also reshaping organizational norms. Nacim Rahal, VP data and AI at Doctolib, explained during the keynote that agents capable of varied tasks blur the separation of responsibilities: “Product managers will directly modify system prompts, and data engineers, ML engineers, and software engineers will find themselves working together on the same kinds of tasks.” At RATP Dev, where over 1,000 of 25,000 employees have adopted Gemini Enterprise, the shift has been deliberate. President Hiba Farès acknowledged they were not early adopters, only moving beyond test-and-learn at the end of 2025 after seeing real ROI and maturity—and after discovering an average of 50 shadow AI requests per employee on professional devices. The executive committee trained at Google, and 50 volunteer “champions”—not from IT or digital roles but “the people you want to talk to at the coffee machine”—now surface daily needs and friction points, helping drive adoption.

Résumé
Lors du Google Cloud Summit Paris 2026, Google Cloud a affirmé son avance avec la plateforme rebaptisée Gemini Enterprise Agent Platform et ses modèles quadrimodaux, tandis qu’AWS reste perçu comme un courtier de LLM et que Microsoft pâtit d’une approche data plus fragmentée. L’infrastructure et les standards comme MCP convergent, mais l’IA agentique pousse des entreprises comme RATP Dev (plus de 1 000 utilisateurs Gemini Enterprise) à repenser leurs usages, tandis que Doctolib souligne une remise en cause de la séparation des responsabilités dans les systèmes.

Il y a AWS, Microsoft et Google Cloud ; mais n’oublions pas Alibaba Cloud.

On nous a fait la remarque au Google Cloud Summit Paris 2026. Nous nous intéressions à la façon dont clients et partenaires percevaient la constitution des stacks agentiques chez les « trois grands » clouders américains. Avec un angle en particulier : convergence ou divergence ?

Alibaba nous a été mentionné pour sa promptitude à implémenter OpenClaw / Hermes, à l’appui d’une sandbox spécifique. NVIDIA a souvent été cité en parallèle, lui qui s’est aussi positionné sur le sujet, sous la bannière OpenShell.

Google Cloud, en avance sur les modèles first-party

Des TPU aux agents prépackagés, le niveau de maîtrise de Google Cloud sur sa stack n’a pas échappé aux participants (quelque 3600 annoncés). Et la marque Gemini Enterprise Agent Platform, forme de rebrand de Vertex AI, semble avoir fait son effet.

Cette maîtrise – ou tout du moins sa démonstration – a particulièrement transparu au niveau des LLM. Dans la keynote introductrice du Summit, il n’y en a guère eu que pour Gemini. Une famille qui s’oriente de plus en plus ouvertement sur la « quadrimodalité » (texte, image, audio, vidéo). Gemini Omni et Gemma 4 en sont les derniers témoins. On nous a rappelé, à ce propos, que Gartner avait classé Google comme « leader » sur la multimodalité.

AWS a aussi des modèles maison (Nova). Mais le marché se montre bien plus circonspect à leur égard. Si bien qu’il assimile encore la filiale d’Amazon à un broker de LLM. Quant à Microsoft, en conséquence de son partenariat pour le moins étroit avec OpenAI, il s’est diversifié tardivement. Son catalogue comprend des modèles first-party, mais qui ne sont pas encore passés à l’échelle.

Sur la data, un Microsoft plus « siloté », un AWS plus « agnostique »

Des divergences, il y en a aussi côté data. Dans ces métiers, on a tendance à considérer le socle Microsoft Foundry comme plus fragmenté que les piles de Google Cloud et d’AWS. Ce dernier a une approche plus agnostique (« venez comme vous êtes »), nous indique-t-on, même si les deux autres s’ouvrent progressivement.

Sur l’infrastructure, l’opinion est largement à la convergence. Le mot « commodité » ressort souvent. On nous cite, par exemple, les SaaS de chunking « au coût négligeable » et la normalisation des tokenizers qui favorise la portabilité des RAG.

MCP, dénominateur commun mais pas universel

Il existe, plus globalement, une certaine parité sur les éléments nécessaires à l’industrialisation (sécurité, habilitation, évaluations…), nous explique-t-on. L’arrivée de standards d’industrie y contribue. MCP en tête, même si, nous signale-t-on, il n’est pas forcément la meilleure manière d’exposer des API. Google Cloud a d’ailleurs fait la part des choses : s’il a « MCPisé » ses services, il propose d’autres voies d’interaction, comme Workspace CLI et Antigravity CLI.

Si l’infra n’est pas un grand marqueur de différenciation entre clouders, elle leur donne un avantage sur les labs IA. Claude a aujourd’hui un meilleur rapport coût/performance sur GCP que sur les serveurs d’Anthropic, témoigne un partenaire Google Cloud.

Une convergence dans l’impulsion de l’IA agentique, moins dans les cibles

Clients et partenaires sont globalement de l’avis que les « trois grands » convergent dans leur manière d’impulser l’IA agentique. Leur historique joue néanmoins. AWS reste orienté B2B. Il est, par exemple, le seul à pouvoir revendiquer de véritables use cases en modernisation mainframe. Microsoft, au contraire, est orienté B2C. Google l’est aussi majoritairement. On lui prête, en parallèle, un mindset plus « ouvert »… au risque d’abandonner plus facilement des produits. On nous mentionne, à ce propos, la mauvaise surprise qu’avait eue Veolia à l’annonce de l’arrêt de Google Cloud Print, alors qu’il avait standardisé son parc sur du Chromebook.

Quand on demande directement aux équipes de Google Cloud, elles revendiquent en premier lieu l’historique du groupe en matière de recherche fondamentale. En vitrine, DeepMind, à qui on doit l’article fondateur « Attention is All You Need »… et, entre autres, AlphaFold, que nous a spontanément cité un partenaire (ce modèle ouvert prédit la structure des protéines à partir de leur séquence en acides aminés).

La séparation des responsabilités remise en cause

Convergence ou divergence, le paradigme agentique remet en tout cas en cause certaines bonnes pratiques. Dont la séparation des responsabilités dans les systèmes, selon Nacim Rahal, VP data & IA de Doctolib, intervenu lors de la keynote. « On peut avoir un agent capable de faire plein de choses différentes. Des choses qui impactent les systèmes eux-mêmes, mais aussi le design de l’organisation qui va permettre de les produire. On va avoir des product managers qui vont directement modifier les prompts des systèmes. Des data engineers, ML engineers et software engineers qui se retrouvent à travailler ensemble sur le même genre de tâche ».

Sur les 25 000 employés de RATP Dev, « plus de 1000 » ont basculé sur Gemini Enterprise. « On n’a pas été des early adopters », admet Hiba Farès, présidente du directoire. L’entreprise avait commencé à expérimenter des solutions en 2023, mais elle n’a véritablement poussé au-delà du test & learn qu’à partir de fin 2025. « Je commençais à percevoir une maturité, explique Hiba Farès. Des gens qui parlaient de vrais use cases [pouvant] apporter un ROI intéressant. » « Notre data commençait à circuler un peu trop à l’extérieur de l’entreprise », admet-elle aussi, évoquant « 50 requêtes de shadow AI par collaborateur sur les devices professionnels ».

« Voir en apprentissage ces gens qui ont une vraie autorité sur le métier, ça a débloqué quelque chose », déclare l’intéressée à propos du codir, qui est allé se former chez Google. RATP Dev a aussi 50 « champions » volontaires… qui ne viennent pas de l’IT, ni du digital. « Ce ne sont pas des spécialistes du métier. Ce sont les personnes auxquelles vous avez envie de parler autour de la machine à café. » Ces « capteurs de terrain » font remonter, au quotidien, les besoins et les points de friction.

Illustration générée par IA

The post Entre hyperscalers, les stacks agentiques se suivent… et se ressemblent ? appeared first on Silicon.fr.

AI Insight

中文 EN

Core Point

超大规模云商（AWS、微软、谷歌云等）的智能体技术栈趋于同质化，但在模型、数据和市场定位上仍存差异，这影响企业AI选型与生态格局。

Key Players

Google Cloud — 推出Gemini企业智能体平台，主打多模态模型与端到端整合，美国。
AWS — 被视为大语言模型“经纪人”，侧重B2B与大型机现代化用例，美国。
Microsoft — 依托OpenAI，Foundry数据底座较碎片化，偏B2C，美国。
阿里云 — 迅速实现OpenClaw/Hermes沙箱，展现技术跟进速度，中国。
NVIDIA — 以OpenShell切入智能体领域，提供底层工具，美国。

Industry Impact

ICT: 高 — 云商主导智能体架构与标准，如MCP协议，影响企业IT基础设施选型。
Computing/AI: 高 — 智能体栈的收敛与分化直接决定AI开发工具链和模型市场走向。

Tracking

Strongly track — 超大规模厂商的智能体战略将深度影响企业云支出和AI部署路径。

Related Companies

No companies linked yet

AI Processing

2026-06-05 12:35

deepseek / deepseek-v4-pro