在云端 VM 的单线程性能上,Arm 实例已经追上 Intel 和 AMD;但从“成本/性能”角度看,AMD 仍然没有出局,尤其是在多线程和部分长期合约场景中依旧具备竞争力。SpareRoom 开发者 Dimitrios Kechiagas 继 2024 年秋季对 7 家云厂商、30 款 VM 做过一次比较后,近期把测试扩展到 44 款 VM,仍覆盖 Akamai、Amazon、DigitalOcean、Google、Hetzner、Microsoft 和 Oracle,重点依然是 CPU 型通用负载。
这次基准测试的方法也有所调整。测试容器以 Docker 形式提供,核心仍包含 Geekbench 5、Phoronix 的 OpenSSL 和 7-zip 测试,但不再编译 Linux 内核,改为 nginx 测试,并新增 FFmpeg 转码。主干仍是自研的 DKbench,包含约 20 项任务,例如在 wiki 页面中嵌入 CSS、对图像做高斯噪声/模糊/分形等滤镜处理、计算质数、统计细菌序列中的 codon、根据天球坐标定位星座等。测试尽量按每个 vCPU 配 2GB 内存、30GB SSD 启动盘进行;多数情况下使用 Debian 13 64 位,少数用 Ubuntu 24.04,OCI 的 Arm VM 则用 Oracle Linux。对于强制至少 4 vCPU、且无法关闭超线程的实例,结果会做外推;为了获得更有代表性的区间,测试还会在不同时间、不同区域创建两到三台实例。
报告以 DKbench 分数/美元衡量成本效益,并分别给出按需、1 年承诺、3 年承诺和 Spot(可抢占)价格下的结果。按需价格取美国和欧洲中更低的区域。
按需计费:单线程
Hetzner 的 CCX13(AMD Milan,8GB/80GB)以 53.80–70.70 分/$ 领先;Oracle 的 Standard.E6(AMD Turin,4/30)紧随其后,54.40–55.10 分/$,已经非常接近 Hetzner。Akamai 的 Linode 4GB(AMD Milan,4/80)为 29.20–37.70,Google 的 n4d-2(AMD Turin,4/30)为 30.10–30.60,DigitalOcean 的 PremAMD 2/4(AMD Rome,4/80,核心共享)为 23.60–27.90,Microsoft 的 D2pls_v6(Azure Cobalt 100,4/32)为 21.90–22.50,Amazon 的 c8a.large(AMD Turin,4/30)则只有 19.40–19.90,整体最弱。作者指出,Oracle 因 AMD Turin 的加持正在逼近 Hetzner,而 AWS 在这一维度上整体最差。
不过,Hetzner 还有一些更高分的共享核心实例,如 CAX11(Ampere Altra,122.30–130.80)、CPX22(AMD Genoa,134.10–142.10)和 CX23(通常 Intel Skylake,有时 AMD Rome,后者可达 144.20–175.70),但由于可用性有限,作者认为它们不算真正可比,因此未纳入正式结果。
按需计费:多线程
Oracle 的 Arm 实例全面领先:Standard.A4(Ampere AmpereOne M,4/30)达到 89.40–90.23 分/$,Standard.A2 为 79.33–80.54,Standard.A1 为 69.57–71.54;Oracle 的 Turin 实例也有 65.93–66.86。Hetzner 的 CCX13 为 63.47–84.84,Akamai 为 57.63–73.96,DigitalOcean 为 44.61–55.61,Microsoft 的 D2pls_v6 为 42.89–44.69,Google 的 c4a-2(Google Axion,4/30)为 42.00–42.09,Amazon 的 c8a.large 为 38.72–39.26。这里 Arm 实例优势明显,AWS 在多线程上比单线程更接近 Google 的 Axion 和 Microsoft 的 Cobalt 100,但仍落后于 Oracle。
文中还提醒,部分 x64 VM 默认关闭超线程,此时 2 vCPU 就等于 2 个物理核心,例如 Amazon 的 c7a 系列。DigitalOcean 的 PremAMD 2/4 使用 AMD Rome;Akamai 的 Linode 4GB 也是共享核心,分配到的 CPU 类型会变化,但多数情况下是 AMD Milan。
1 年承诺:单线程
Google 的 n4d-2 以 46.89–47.71 分/$ 反超 Oracle 的 Standard.E6(54.38–55.14),与 Hetzner 的 CCX13(53.80–70.71)处于同一梯队。Microsoft 的 D2pls_v6 为 35.84–36.95,Akamai 为 29.21–37.67,Amazon 的 c8i.large(Intel Granite Rapids,4/30)为 26.85–27.64,DigitalOcean 为 23.64–27.86。Google 的折扣让它在 AMD Turin 上的性价比足以追平 Oracle,而 Azure 在 Cobalt 100 和 AMD Genoa 上都显得更有吸引力。
1 年承诺:多线程
Oracle 的 Standard.A4 仍居首,89.40–90.23;Hetzner 为 63.47–84.84,Microsoft 的 D2pls_v6 提升到 70.31–73.27,Akamai 为 57.63–73.96,Google 的 c4a-2 为 62.75–62.88,Amazon 的 c8a.large 为 53.03–53.77,DigitalOcean 为 44.61–55.61。Oracle 依旧凭 Arm 领先,但 Microsoft 的 Cobalt 100 和 Google 的 Axion 已经明显逼近,AWS 的成本/性能也比此前有显著改善。
3 年承诺:单线程
Google 的 n4d-2 进一步占优,达到 64.43–65.55 分/$;Hetzner 的 CCX13 为 53.80–70.71,Oracle 的 Standard.E6 为 54.38–55.14,Microsoft 的 D2pls_v6 为 53.19–54.82,Amazon 的 c8i.large 为 39.29–40.45,Akamai 为 29.21–37.67,DigitalOcean 为 23.64–27.86。Google 在 1 年和 3 年承诺下的优势一致,仍主要得益于 AMD Turin;Microsoft 也因同类芯片而更具吸引力。AWS 虽落后,但仍优于 Akamai 和 DigitalOcean。
3 年承诺:多线程
Microsoft 的 D2pls_v6 以 104.34–108.73 分/$ 夺冠,Google 的 c4a-2 为 90.22–90.41,Oracle 的 Standard.A4 为 89.40–90.23,Amazon 的 c8a.large 为 77.94–79.02,Hetzner 为 63.47–84.84,Akamai 为 57.63–73.96,DigitalOcean 为 44.61–55.61。这里多核物理核心数量开始决定胜负,Microsoft 的 Cobalt 100 表现最好,AWS 也已进入第一梯队。
Spot/预留实例:单线程
作者采用 2026 年 1 月美国地区的最低 Spot 价格。Google 的 c3d-4/2(AMD Genoa,4/30,按 4 vCPU 外推到 2 vCPU)为 111.46–114.89 分/$;Oracle 的 Standard.E6 为 104.23–105.68;Microsoft 的 D2pls_v6 为 93.20–96.06;Hetzner 为 53.80–70.71;Amazon 的 c8a.large 为 54.09–55.53;Akamai 为 29.21–37.67;DigitalOcean 为 23.64–27.86。Oracle 因固定 50% 折扣,在 Spot 场景下依然非常划算,价格大致相当于 3 年承诺的一半。
Spot/预留实例:多线程
Microsoft 的 D2pls_v6 以 182.83–190.52 分/$ 领先,Oracle 的 Standard.A4 为 167.79–169.35,Google 的 t2d-2(AMD Milan,8/30)为 138.55–153.54,Amazon 的 c8a.large 为 108.23–109.74,Hetzner 为 63.47–84.84,Akamai 为 57.63–73.96,DigitalOcean 为 44.61–55.61。前两名都来自 Arm:Microsoft 的 Cobalt 100 和 Oracle 的 AmpereOne M;Google 的 t2d(AMD Milan)虽然曾在 2024 年秋季就表现突出,这次仍排第三。
总体来看,Hetzner 的 CCX13 在不同数据中心之间的性能波动最大。Microsoft 在 AMD Turin 的上线节奏上落后于 Amazon 和 Google,直到 2026 年 1 月底才正式 GA;Intel Granite Rapids 仍处于 preview。DigitalOcean 的机型则明显显老,但其低价且跨区域稳定的定价,对那些并不特别看重成本/性能比的负载仍有吸引力。