Jusqu’à 87 % de dépenses en moins par rapport aux API cloud : Dell a choisi son angle d’attaque pour Deskside Agentic AI.
Sous cette marque, il étend officiellement son AI Factory en local et en périphérie, essentiellement sur des systèmes Pro Max, Pro Precision et PowerEdge. Toujours avec l’écosystème NVIDIA, des modèles Nemotron au runtime OpenShell.
La logique économique est au cœur de son argumentaire. Le postulat est simple : autant avec l’IA « traditionnelle » (« un prompt = une réponse »), les coûts sont relativement prévisibles, autant avec l’IA agentique, ils peuvent enfler rapidement.
Une simulation de coûts sur trois workloads agentiques
Les 87 % annoncés proviennent d’une étude que Dell a commandée à Signal65, cabinet américain à l’origine duquel on trouve notamment l’analyste Patrick Moorhead.
L’étude compare les options API cloud et Dell AI Factory sur trois profils de workloads : « travail de la connaissance », ventes et développement logiciel. Le premier comprend des tâches d’une complexité jugée faible (questions-réponses, écriture d’e-mails, résumé de réunions, édition de documents…) et moyenne (analyse de données, assistance à la recherche, écriture d’articles de blog…). Le deuxième est à moitié-moitié entre des tâches de complexité faible et élevée, que Signal65 ne détaille pas. Quant au troisième, il combine tâches de difficulté moyenne (écriture de documentation, recherche de patterns, comparaison d’approches…) et élevée (génération de fonctions, intégration d’API, revue de code, tests unitaires…).
La simulation se fonde sur un fonctionnement en continu, 260 jours par an sur une période de 2 ans. Elle implique un taux d’utilisation hardware de 60 % pour ventes et « travail de la connaissance » ; de 80 % pour le développement logiciel.
Les agents sélectionnés étaient fondés sur deux types de modèles :
Nemotron-3-Nano-30B-A4B pour le « travail de la connaissance »
Nemotron-3-Super-120B-A12B pour le développement logiciel
L’un et l’autre, à 50/50, pour la vente
Le workload « travail de la connaissance » consomme en moyenne 13,3 millions de tokens par jour. Contre 16,3 millions pour le workload vente et 21,3 millions pour le workload développement logiciel.
Les prix retenus pour les configurations cloud…
Les coûts des API cloud représentent la moyenne du marché au 1er mai 2026 pour « des modèles alignés sur les exigences de complexité ». Signal65 n’en dit pas plus à ce propos. Il précise toutefois avoir fixé le prix des accès au cache à 10 % du prix normal des tokens en entrée. Et appliqué une remise uniforme de 40 %.
Agent
Coût moyen en entrée
(par million de tokens)
Coût moyen avec récupération en cache
(par million de tokens)
Taux d’accès au cache
Coût moyen en sortie
(par million de tokens)
Remise cloud
Assistance au « travail de la connaissance »
0,3666 $
0,03666 $
40 %
1,7753 $
40 %
Assistance à la vente
2,1545 $
0,21545 $
50 %
11 $
40 %
Assistance au développement logiciel
5,54$
0,554 $
65 %
28,97 $
40 %
… et ceux pour les configurations sur site
Les solutions on-prem ont été modélisées à partir de données de prix et de performance fournies par Dell et NVIDIA. Pour chaque plate-forme, on a dimensionné les workloads sur la base d’un seuil de performance de 10 tokens/seconde/agent. Aux prix des équipements de bureau, il fallu ajouter les coûts de l’énergie (base non spécifiée). Aux serveurs également, ainsi que les coûts de colocation, de logiciel et de gestion d’infrastructure.
Solution
Prix
Nombre maximal de tokens produits par seconde (Nemotron-3-Nano-
30B-A4B, 10 tokens/seconde/agent,
100 % d’utilisation)
Nombre maximal de tokens par seconde
(Nemotron-3-Super-120B-
A12B, 10 tokens/seconde/agent,
100% d’utilisation)
Dell Pro Max avec GB10
~ 6 k$
32
5
Dell Pro Max T2
avec RTX
PRO 6000 BW
~ 20 k$
300
87,5
Dell Pro Max avec GB300
Ultra
~ 135 k$
1150
280
Dell PowerEdge
XE7740 avec (plusieurs) RTX PRO
6000 BW
~ 1,1 M$
71 188
Non testé
Dell PowerEdge
XE7745 avec
(plusieurs) H200 NVL
~ 1,2 M$
Non testé
24 053
Jusqu’à 17 mois pour rentabiliser
Les quelques prix publics sur le site Dell US correspondent plus ou moins à ceux retenus dans le cadre de cette étude. Il en coûte par exemple 5492 $ HT pour un Pro Max en GB10 avec le maximum de RAM (128 Go LPDDR5X), le minimum de disque (1 To) et sans ProSupport. Un Pro Max T2 en RTX PRO 6000 BW 96 Go configuré avec le maximum de RAM (128 Go DDR5 ECC), le processeur le moins puissant (Core Ultra 5 235) et la plus petite capacité disque (256 Go) revient à un peu plus de 20 000 $.
Dans les conditions sus-exposées, on atteint l’équilibre sous :
6 à 17 mois avec le Pro Max GB10
3 à 11 mois avec le Pro Max GB300 Ultra
2 à 7 mois avec le Pro Max T2 RTX PRO 6000
2 mois avec le PowerEdge XE7745 en H200 NVL
Dell ne met pas en avant les serveurs PowerEdge dans sa présentation de Deskside AI. Il met l’accent sur l’IA locale, en reprenant avant tout les résultats pour la config en GB300 Ultra. C’est là que se trouvent les fameux 87 % de coûts en moins. Ils concernent le workload de développement logiciel (138 k$ vs 1,06 M$ sur les API cloud). On tombe à 86 % pour les ventes et à 56 % pour le « travail de la connaissance ».
Les résultats par workload
(travail de la connaissance)
Différence de coût maximale
Nombre d’agents
Pro Max avec GB10
28 %
8
Pro Max T2 avec RTX PRO 6000 BW
71 %
~ 75
Pro Max avec GB300 Ultra
56 %
~ 300
PowerEdge XE7740 avec RTX PRO 6000 BW
94 %
~ 18k
(ventes)
Différence de coût maximale
Nombre d’agents
Pro Max avec GB10
76 %
4
Pro Max T2 avec RTX PRO 6000
91 %
Jusqu’à 40
Pro Max avec GB300 Ultra
86 %
~ 150
(développement logiciel)
Différence de coût maximale
Nombre d’agents
Pro Max T2 avec RTX PRO 6000
93 %
~ 20
Pro Max avec GB300 Ultra
87 %
~ 60
PowerEdge XE7745 avec H220 NVL
98 %
Plus de 5k
Illlustration © Dell
The post Dell prend l’IA locale sous l’angle de la maîtrise des coûts appeared first on Silicon.fr.