Il y a AWS, Microsoft et Google Cloud ; mais n’oublions pas Alibaba Cloud.
On nous a fait la remarque au Google Cloud Summit Paris 2026. Nous nous intéressions à la façon dont clients et partenaires percevaient la constitution des stacks agentiques chez les « trois grands » clouders américains. Avec un angle en particulier : convergence ou divergence ?
Alibaba nous a été mentionné pour sa promptitude à implémenter OpenClaw / Hermes, à l’appui d’une sandbox spécifique. NVIDIA a souvent été cité en parallèle, lui qui s’est aussi positionné sur le sujet, sous la bannière OpenShell.
Google Cloud, en avance sur les modèles first-party
Des TPU aux agents prépackagés, le niveau de maîtrise de Google Cloud sur sa stack n’a pas échappé aux participants (quelque 3600 annoncés). Et la marque Gemini Enterprise Agent Platform, forme de rebrand de Vertex AI, semble avoir fait son effet.
Cette maîtrise – ou tout du moins sa démonstration – a particulièrement transparu au niveau des LLM. Dans la keynote introductrice du Summit, il n’y en a guère eu que pour Gemini. Une famille qui s’oriente de plus en plus ouvertement sur la « quadrimodalité » (texte, image, audio, vidéo). Gemini Omni et Gemma 4 en sont les derniers témoins. On nous a rappelé, à ce propos, que Gartner avait classé Google comme « leader » sur la multimodalité.
AWS a aussi des modèles maison (Nova). Mais le marché se montre bien plus circonspect à leur égard. Si bien qu’il assimile encore la filiale d’Amazon à un broker de LLM. Quant à Microsoft, en conséquence de son partenariat pour le moins étroit avec OpenAI, il s’est diversifié tardivement. Son catalogue comprend des modèles first-party, mais qui ne sont pas encore passés à l’échelle.
Sur la data, un Microsoft plus « siloté », un AWS plus « agnostique »
Des divergences, il y en a aussi côté data. Dans ces métiers, on a tendance à considérer le socle Microsoft Foundry comme plus fragmenté que les piles de Google Cloud et d’AWS. Ce dernier a une approche plus agnostique (« venez comme vous êtes »), nous indique-t-on, même si les deux autres s’ouvrent progressivement.
Sur l’infrastructure, l’opinion est largement à la convergence. Le mot « commodité » ressort souvent. On nous cite, par exemple, les SaaS de chunking « au coût négligeable » et la normalisation des tokenizers qui favorise la portabilité des RAG.
MCP, dénominateur commun mais pas universel
Il existe, plus globalement, une certaine parité sur les éléments nécessaires à l’industrialisation (sécurité, habilitation, évaluations…), nous explique-t-on. L’arrivée de standards d’industrie y contribue. MCP en tête, même si, nous signale-t-on, il n’est pas forcément la meilleure manière d’exposer des API. Google Cloud a d’ailleurs fait la part des choses : s’il a « MCPisé » ses services, il propose d’autres voies d’interaction, comme Workspace CLI et Antigravity CLI.
Si l’infra n’est pas un grand marqueur de différenciation entre clouders, elle leur donne un avantage sur les labs IA. Claude a aujourd’hui un meilleur rapport coût/performance sur GCP que sur les serveurs d’Anthropic, témoigne un partenaire Google Cloud.
Une convergence dans l’impulsion de l’IA agentique, moins dans les cibles
Clients et partenaires sont globalement de l’avis que les « trois grands » convergent dans leur manière d’impulser l’IA agentique. Leur historique joue néanmoins. AWS reste orienté B2B. Il est, par exemple, le seul à pouvoir revendiquer de véritables use cases en modernisation mainframe. Microsoft, au contraire, est orienté B2C. Google l’est aussi majoritairement. On lui prête, en parallèle, un mindset plus « ouvert »… au risque d’abandonner plus facilement des produits. On nous mentionne, à ce propos, la mauvaise surprise qu’avait eue Veolia à l’annonce de l’arrêt de Google Cloud Print, alors qu’il avait standardisé son parc sur du Chromebook.
Quand on demande directement aux équipes de Google Cloud, elles revendiquent en premier lieu l’historique du groupe en matière de recherche fondamentale. En vitrine, DeepMind, à qui on doit l’article fondateur « Attention is All You Need »… et, entre autres, AlphaFold, que nous a spontanément cité un partenaire (ce modèle ouvert prédit la structure des protéines à partir de leur séquence en acides aminés).
La séparation des responsabilités remise en cause
Convergence ou divergence, le paradigme agentique remet en tout cas en cause certaines bonnes pratiques. Dont la séparation des responsabilités dans les systèmes, selon Nacim Rahal, VP data & IA de Doctolib, intervenu lors de la keynote. « On peut avoir un agent capable de faire plein de choses différentes. Des choses qui impactent les systèmes eux-mêmes, mais aussi le design de l’organisation qui va permettre de les produire. On va avoir des product managers qui vont directement modifier les prompts des systèmes. Des data engineers, ML engineers et software engineers qui se retrouvent à travailler ensemble sur le même genre de tâche ».
Sur les 25 000 employés de RATP Dev, « plus de 1000 » ont basculé sur Gemini Enterprise. « On n’a pas été des early adopters », admet Hiba Farès, présidente du directoire. L’entreprise avait commencé à expérimenter des solutions en 2023, mais elle n’a véritablement poussé au-delà du test & learn qu’à partir de fin 2025. « Je commençais à percevoir une maturité, explique Hiba Farès. Des gens qui parlaient de vrais use cases [pouvant] apporter un ROI intéressant. » « Notre data commençait à circuler un peu trop à l’extérieur de l’entreprise », admet-elle aussi, évoquant « 50 requêtes de shadow AI par collaborateur sur les devices professionnels ».
« Voir en apprentissage ces gens qui ont une vraie autorité sur le métier, ça a débloqué quelque chose », déclare l’intéressée à propos du codir, qui est allé se former chez Google. RATP Dev a aussi 50 « champions » volontaires… qui ne viennent pas de l’IT, ni du digital. « Ce ne sont pas des spécialistes du métier. Ce sont les personnes auxquelles vous avez envie de parler autour de la machine à café. » Ces « capteurs de terrain » font remonter, au quotidien, les besoins et les points de friction.
Illustration générée par IA
The post Entre hyperscalers, les stacks agentiques se suivent… et se ressemblent ? appeared first on Silicon.fr.