Intel a trouvé son premier client cloud pour sa puce accélératrice IA Gaudi 3 : IBM Cloud.
IBM et Intel ont annoncé jeudi qu'IBM Cloud commencera à proposer Gaudi 3 aux clients début de l'année prochaine. Les accélérateurs de la puce seront disponibles pour des environnements hybrides et sur site, et IBM dit qu'il prévoit de prendre en charge Gaudi 3 dans sa plateforme Watsonx AI et données.
"Débloquer tout le potentiel de l'IA nécessite un écosystème ouvert et collaboratif qui offre aux clients un choix de solutions accessibles", a déclaré Justin Hotard, directeur général de la division des datacenters et de l'IA d'Intel. "En intégrant les accélérateurs IA Gaudi 3 et les CPU Xeon avec IBM Cloud, nous créons de nouvelles capacités d'IA et répondons à la demande de solutions informatiques IA abordables, sécurisées et innovantes."
Gaudi 3, dévoilé en décembre 2023, était censé être la réponse d'Intel aux puces IA de ses concurrents Nvidia et AMD. C'est la fin de la série d'accélérateurs Gaudi que Intel a obtenue grâce à son acquisition de 2 milliards de dollars de Habana Labs en 2019.
Intel a présenté plus tôt cette année des designs de référence de Gaudi 3 que des partenaires comme Lenovo, Dell, HPE et Super Micro pourraient utiliser dans des serveurs. Les designs comprennent une nouvelle forme de connectivité Ethernet conçue pour rivaliser avec la technologie de connectivité InfiniBand de Nvidia. Ils associent également des puces Gaudi 3 aux séries de processeurs Xeon 6 d'Intel.
Mais Gaudi 3 est arrivé à un moment délicat pour Intel, qui a été fortement désavantagé par l'ancienneté de Nvidia.
En avril, Intel a déclaré qu'il s'attendait à générer un chiffre d'affaires de 500 millions de dollars avec Gaudi 3 en 2024, une somme dérisoire par rapport aux 3,5 milliards de dollars qu'AMD prévoit de réaliser avec ses GPU de la série Instinct MI300, et aux 40 milliards de dollars que Nvidia prévoit de tirer de son activité de datacenter. Les premiers benchmarks montrent que Gaudi 3 offre une performance impressionnante pour le prix, mais attirer des clients qui ont déjà de solides relations avec Nvidia présente un défi.
En juillet, le directeur technique d'Intel, Greg Lavender, a déclaré avec optimisme que la société pourrait prendre la deuxième place sur le marché des puces IA derrière Nvidia. Un mois plus tard, après avoir enregistré une perte de 1,6 milliard de dollars pour le T2, Intel a déclaré qu'il supprimerait 15 000 emplois et réduirait agressivement les coûts pour économiser 10 milliards de dollars en 2025.
Pour aggraver la situation pour Intel, Nvidia a l'intention d'augmenter la production de sa puce IA de nouvelle génération, Blackwell, au T4 après un bref retard de fabrication. Blackwell offrira jusqu'à quatre fois les performances de l'H100, la puce avec laquelle Gaudi 3 se compare favorablement.
Intel a pris soin de ne pas fournir de comparaisons avec Blackwell, affirmant qu'il ne le peut pas tant que les puces Blackwell ne sont pas publiquement disponibles.