AI数据中心,Arm首款CPU的理想蓝图

Le datacenter IA, trame idéale pour le premier CPU d’Arm

Silicon.fr by Clément Bohic 2026-04-22 17:06 Original
摘要
Arm公司推出了其首款面向AI数据中心的服务器CPU——AGI CPU,基于Neoverse V3架构,提供64至136核心配置。该处理器旨在应对未来AI代理工作负载,通过CPU协调任务以释放GPU算力,已获得SK Telecom、Cloudflare及SAP等客户支持,并计划与Meta的MTIA加速器协同优化能效。Arm此举标志着其从IP授权向芯片销售的拓展,目标在两年内实现超10亿美元收入,同时强调不会与现有客户(如AWS、谷歌)直接竞争。

Arm推出首款服务器CPU,瞄准AI数据中心与智能体工作负载

在AI数据中心,CPU在协调计算资源方面仍扮演关键角色。随着智能体(agent)技术的发展,这一需求预计将进一步增强。为此,Arm近期发布了其首款面向服务器的处理器——AGI CPU,基于Neoverse V3架构设计。该架构也被英伟达的Vera、AWS的Graviton、微软的Cobalt及谷歌的Axion等芯片所采用。

AGI CPU提供64核、128核和136核三种配置,热设计功耗(TDP)为300瓦。Arm设计了参考服务器方案(1U规格,支持单节点或双节点),并可扩展为采用风冷的30U机架(功耗36千瓦,最高支持8160个核心)。华擎和联想已将其纳入产品目录。此外,Arm还与超微合作开发了液冷设计的42U机架方案(功耗200千瓦,最高可容纳45,696个核心)。

在内存选择上,出于成本和容量考虑,Arm选择了DDR而非LPDDR。考虑到带宽限制(在136核配置中,每核约6GB),Arm认为集成多线程技术并不理想,因为其对能效比的提升并不显著。I/O方面支持PCIe Gen6和CXL 3.0,未来Neoverse架构更新后将加入对NVLink的支持。

智能体工作负载驱动需求

Arm指出,当前数据中心CPU密度约为每吉瓦(GW)3000万核心。为应对异步、高调度需求的智能体工作负载,预计所需核心数量将增至当前的四倍。这类任务适合由CPU处理调度与控制流,而GPU则可专注于令牌生成等计算密集型任务。

韩国运营商SK Telecom已采用AGI CPU作为头节点,搭配Rebellions的NPU来运行其基础模型A.X。Cloudflare、F5 Networks以及SAP也成为其客户。SAP已在AWS的Graviton上部署HANA数据库,并寻求在其他环境(包括“主权云”场景)复制类似能力。

Meta是AGI CPU的早期需求方,计划将其与自研加速器MTIA协同使用,并已与Arm合作适配PyTorch、vLLM及FBGEMM等软件栈,目标是将CPU节省的功耗全部用于推理任务。

商业模式拓展与市场定位

此次推出自研芯片是Arm商业模式的重要拓展。此前Arm主要销售IP核和CSS(集成子系统),现在通过提供完整芯片,可触达那些缺乏自研能力或时间紧迫的客户,如电信运营商、新兴云服务商和网络设备提供商。

对于可能与现有芯片设计客户产生竞争的问题,Arm表示市场空间足够大,并引用此前推广CSS的经验,称并未影响合作关系。CEO Rene Haas亦含蓄指出,Arm的芯片具有“中立性”优势,而某些“客户兼竞争对手”(如为配合Rubin GPU而定制核心数与接口的英伟达Vera CPU)可能不具备这一特点。

Arm已为未来两代CPU(2026-2027年)锁定客户,并预计相关业务在两年内将带来“超过10亿美元收入”。产能已通过一家ASIC合作伙伴在台积电确保,但内存短缺是Haas更担忧的问题。

在财务方面,Arm宣布其IP授权费率为5%,毛利率亦为5%;CSS的毛利率则为10%。而自研芯片预计将带来50%的毛利率,未来可能在财报中单独列示。

Summary
Arm has launched its first server CPU, the AGI CPU, based on the Neoverse V3 architecture, targeting AI data centers where CPUs orchestrate workloads, especially for emerging "agentic" AI. Key clients include Meta, SK Telecom, SAP, Cloudflare, and F5 Networks, with the chip designed to work alongside GPUs and NPUs to improve power efficiency for AI inference. Arm aims to generate over $1 billion in revenue from this new chip business within two years, marking a strategic shift from selling only IP to delivering its own silicon, while navigating potential competition with its own licensees like NVIDIA and AWS.

Arm has launched its first server CPU, the AGI CPU, marking a strategic shift from solely licensing intellectual property to selling its own silicon. Based on the Neoverse V3 architecture, it joins a growing field of custom Arm-based server chips from major cloud providers like AWS (Graviton), Microsoft (Cobalt), and Google (Axion).

The new CPU is designed specifically for AI data centers, where Arm argues CPUs are critical for orchestrating workloads, a role that will intensify with the rise of agentic AI. The chip is offered in 64, 128, and 136-core configurations within a 300W thermal envelope. Arm has also developed reference server designs: a 1U air-cooled system (with 1 or 2 nodes) and a 30U rack (36 kW, up to 8,160 cores). Partners like ASRock, Lenovo, and Supermicro are offering systems, with Supermicro collaborating on a 42U liquid-cooled rack design supporting up to 45,696 cores.

Technical choices reflect data center priorities. Arm opted for standard DDR memory over LPDDR for cost and capacity reasons. Given bandwidth limitations (6GB per core in the 136-core configuration), it decided against integrating multithreading, as the performance-per-watt gain was deemed insignificant. For I/O, it supports PCIe Gen6 and CXL 3.0, with NVLink support planned for a future Neoverse revision.

Arm frames the launch as a response to a looming compute bottleneck. It states that current data centers achieve a density of about 30 million CPU cores per gigawatt but estimates agentic AI workloads will require four times that capacity. These asynchronous workloads generate significant planning and control flow tasks, which are ideal for CPUs, freeing GPUs to focus on token generation.

Early customers validate the strategy. SK Telecom is using the AGI CPU as a head node alongside NPUs from Rebellions to run its A.X foundation model. Cloudflare, F5 Networks, and SAP have also signed on, with SAP seeking to replicate its HANA-on-Graviton capabilities from AWS in other environments, including sovereign cloud offerings. The initial demand, however, came from Meta, which plans to pair the CPU with its MTIA accelerators and has worked with Arm to optimize software stacks like PyTorch, vLLM, and FBGEMM. The goal is to maximize power efficiency: every watt saved on the CPU will be redirected to power inference tasks.

This move into selling finished chips targets a new customer segment: companies like telcos, network providers, and smaller cloud players ("néoclouds") that lack the resources or scale to develop custom silicon in a timely manner. Arm downplays potential conflict with its existing IP licensees, like NVIDIA with its Vera CPU, arguing the market is large enough. CEO Rene Haas points to the precedent of its CSS (Core-System-Subsystem) business, which didn't compromise client relationships, and subtly highlights Arm's "neutrality" compared to optimized vendor-specific designs.

Arm has committed customers for its first two CPU generations (2026-2027) and is targeting "over a billion dollars" in revenue from this business within two years. Production capacity has been secured at TSMC via an ASIC partner, though Haas expresses greater concern over potential memory shortages. Financially, the company cites a 5% royalty rate (with a similar gross margin) for its IP and 10% for CSS. It claims its own chips will deliver a 50% gross margin and will likely be reported as a separate financial segment.

Résumé
Arm lance son premier processeur pour serveurs IA, l'AGI CPU, basé sur l'architecture Neoverse V3 et visant à orchestrer les charges de travail agentiques en complément des GPU. Des acteurs comme SK Telecom, Meta, SAP et des néoclouds sont déjà clients, Arm visant plus d'un milliard de dollars de revenus d'ici 2027. Cette entrée en production de puces complètes, une première pour l'entreprise, élargit son modèle au-delà de la vente d'IP et pourrait toucher des marchés comme les télécoms tout en générant des marges brutes plus élevées.

Dans les datacenters IA, les CPU ont toute leur place pour orchestrer la mécanique. Et le besoin va s’accentuer avec l’agentique.

Il y a quelques semaines, Arm a contextualisé ainsi le lancement de son premier processeur, pour serveurs. Nommé AGI CPU, il est basé sur l’architecture Neoverse V3. Comme, entre autres, les puces Vera (NVIDIA), Graviton (AWS), Cobalt (Microsoft) et Axion (Google).

Arm propose des configurations à 64, 128 et 136 cœurs, dans une enveloppe thermique de 300 W. Il a conçu un serveur de référence (1U, à 1 ou 2 nœuds), décliné en un rack avec refroidissement à air (30U, 36 kW, jusqu’à 8160 cœurs). ASRock et Lenovo en ont aussi à leur catalogue. Comme Supermicro, avec lequel Arm a également conçu un design 42U à refroidissement liquide (200 kW ; jusqu’à 45 696 cœurs).

Côté mémoire, la DDR a été préférée à la LPDDR, tant pour des questions de coût que de capacité. Vu les limites de bande passante (6 Go par cœur dans la config à 136 cœurs), Arm n’a pas jugé idéal d’intégrer le multithreading – d’autant plus que l’amélioration du rapport performance par watt n’est pas significative. Pour l’I/O, on est sur du PCIe Gen6 (+ CXL 3), en attendant la prise en charge de NVLink dans une future révision de Neoverse.

SAP intéressé pour HANA

Les datacenters en sont arrivés à une densité d’environ 30 millions de cœurs CPU par GW, affirme Arm. L’entreprise estime que pour absorber les workloads agentiques, il en faudrait 4 fois plus. Et pour cause : ces workloads sont asynchrones, ce qui engendre autant de travail de planification et de contrôle des flux. Des tâches qu’on peut déléguer à des CPU, en concentrant les GPU sur la production des tokens.

L’opérateur coréen SK Telecom fait partie des clients de l’AGI CPU. Il l’exploite comme nœud de tête, en combinaison avec des NPU de Rebellions, pour faire tourner son modèle de fondation A.X.

Arm a aussi rallié Cloudflare et F5 Networks. Ainsi que SAP. Le groupe allemand a déployé HANA sur Graviton chez AWS et cherche à en reproduire les capacités sur d’autres environnements, notamment dans le contexte des offres « souveraines ».

La première demande était toutefois venue de Meta, qui compte utiliser l’AGI CPU en association avec ses accélérateurs MTIA. Il a déjà travaillé avec Arm pour adapter diverses briques logicielles, dont PyTorch, vLLM et FBGEMM (Facebook GEneral Matrix Multiplication). Objectif, dans les grandes lignes : tous les watts économisés sur le CPU alimenteront l’inférence.

Les néoclouds dans le viseur

Ce SoC est une première pour Arm. Qui, jusqu’ici, vendait de l’IP (blocs de propriété intellectuelle) et du CSS (sous-systèmes packageant ces blocs). En livrant des puces, il se donne la possibilité de toucher des acteurs qui n’ont pas les moyens ou l’échelle pour développer les leurs, en tout cas en temps voulu : telcos, néoclouds, fournisseurs réseau…

Quant à la perspective de concurrencer ses clients actuels, Arm assure ne pas être inquiet : le marché est suffisamment grand. Il rappelle avoir connu, avec le CSS, une situation similaire qui n’a, au final, pas compromis ses relations contractuelles. Son patron Rene Haas avance aussi, à demi-mot, l’argument de la neutralité… que n’auront peut-être pas les « clients-concurrents » (il évoque les CPU Vera, conçus pour fonctionner avec le GPU Rubin, avec une interface spécifique et un nombre de cœurs optimisé).

Arm a des clients engagés pour les deux premières générations de son CPU (2026-2027). Il dit avoir en ligne de mire « plus d’un milliard de dollars de revenus » sur un horizon de 2 ans. La capacité a été sécurisée auprès de TSMC via un partenaire ASIC. La pénurie de mémoire inquiète davantage Rene Haas.

Sur l’IP, Arm annonce un taux de royalties de 5 %, pour autant de marge brute. C’est 10 % sur le CSS. Ses puces, clame-t-il, lui permettront de dégager 50 % de marge brute. Elles feront probablement l’objet d’un segment distinct dans le reporting financier.

Illustrations © Arm

The post Le datacenter IA, trame idéale pour le premier CPU d’Arm appeared first on Silicon.fr.

AI Insight
Core Point

Arm has launched its first server CPU, the AGI CPU, targeting AI datacenters to manage the growing computational demands of agentic AI workloads, marking a strategic shift from selling only IP to delivering its own chips.

Key Players

Arm — Designs CPU architecture/IP, now producing its own server chips, based in the UK.

NVIDIA, AWS, Microsoft, Google — Tech giants designing their own server CPUs (Vera, Graviton, Cobalt, Axion) based on Arm's IP.

ASRock, Lenovo, Supermicro — Hardware manufacturers offering servers based on Arm's new CPU designs.

SK Telecom, Cloudflare, F5 Networks, SAP, Meta — Early clients adopting the AGI CPU for AI, networking, and enterprise applications.

Industry Impact
  • ICT: High — New competitive server CPU for AI infrastructure.
  • Computing/AI: High — Directly targets AI datacenter orchestration and agentic workloads.
Tracking

Strongly track — Arm's entry as a direct chip supplier could reshape the competitive landscape for AI datacenter CPUs and its relationships with major cloud clients.

Related Companies
positive
Google
mature
neutral
Meta
mature
positive
neutral
Nvidia
mature
neutral
SAP
mature
neutral
neutral
neutral
neutral
vLLM
startup
neutral
TSMC
mature
neutral
Arm
mature
positive
Lenovo
mature
neutral
ASRock
mature
neutral
positive
neutral
Rebellions
startup
neutral
neutral
neutral
Categories
半导体 人工智能 云计算
AI Processing
2026-04-22 21:44
deepseek / deepseek-chat