Lors du Computex de cette année, Intel a attiré l’attention avec le lancement de Gaudi 3, son nouvel accélérateur d’IA. Il succède à Gaudi 2, un modèle sorti en mai 2022. Le géant de l’informatique mise sur cette nouvelle technologie pour rivaliser avec Nvidia, le leader incontesté du marché des GPU dédiés à l’intelligence artificielle. Pour séduire les entreprises, Intel met en avant plusieurs atouts de son produit, en particulier son rapport qualité-prix et ses performances d’inférence remarquables.
Caractéristiques techniques de Gaudi 3
Produite par TSMC sur un processus de 5 nanomètres, Gaudi 3 est une prouesse technologique. Ce composant utilise 96 Mo de S-RAM et dispose de 128 Go de mémoire HBM2e, permettant d’atteindre une bande passante maximale de 3,7 To/s. Ces spécifications soulignent la capacité de Gaudi 3 à traiter des quantités massives de données à grande vitesse.
Intel a aussi mis l’accent sur l’intégration de Gaudi 3 dans les infrastructures cloud. « L’état actuel de l’utilisation du cloud est tel que 60% de toutes les charges de travail s’exécutent dans le cloud et 80% des données générées sont encore inexploitées, » a déclaré Pat Gelsinger, PDG d’Intel.
Stratégie de pénétration de marché
En lançant Gaudi 3, Intel vise principalement à contester la suprématie de Nvidia dans le domaine des GPU pour l’IA. « Les organisations veulent des alternatives et une architecture ouverte, » a tempéré Gelsinger. En conséquence, Intel offre une solution susceptible d’optimiser le temps de mise sur le marché et le coût total de possession (TCO).
Pour illustrer cette vision, Intel collabore avec l’Open Source Linux Foundation pour créer une plateforme d’IA d’entreprise. Les nouveaux processeurs Xeon 6 et les accélérateurs Gaudi joueront un role clé dans l’alimentation des charges de travail globales en IA, augmentant ainsi l’attrait des solutions Intel pour les entreprises.
Disponibilité et partenariats
Pour garantir une adoption rapide, Gaudi 3 sera disponible sous trois formes distinctes : HL-325L, HLB-325 et HL-338. Ces différentes versions permettent une flexibilité d’intégration, des servers aux stations de travail. Le modèle phare, HL-325L, est un module d’accélération pour serveurs basé sur le standard OCP. Le HLB-325 est un module UBB incluant huit unités HL-325L, et enfin, le HL-338 est une carte d’extension pour stations de travail.
Lors de son annonce, Intel a révélé que plus de 10 fournisseurs mondiaux offriront des solutions basées sur Gaudi 3 : Foxconn, Gigabyte, Inventec, Quanta et Wistron ont rejoint Dell Technologies, HPE, Lenovo et Supermicro pour étendre l’écosystème des serveurs AI.
Emoji | Résumé |
---|---|
💻 | Caractéristiques techniques avancées |
📈 | Stratégie de marché concurrentielle |
🔧 | Disponibilité en trois versions |
Comparatif des performances
Intel n’a pas manqué de comparer les performances de Gaudi 3 avec celles de Nvidia. Selon ses tests, un cluster de 8 192 Gaudi 3 réduit le temps de formation des modèles de 40 % par rapport à un cluster Nvidia H100 équivalent. Cela positionne Gaudi 3 comme une alternative viable pour des applications exigeantes telles que Meta Llama2, un Large Language Model de 70 milliards de paramètres.
Un autre argument de poids est que Gaudi 3 fonctionne sur Ethernet, une interface standard de l’industrie. Il est également optimisé pour les frameworks d’IA open-source comme Python, rendant la transition plus fluide pour les équipes de développement.
- Caractéristiques techniques produites par TSMC
- Collaboration avec l’Open Source Linux Foundation
- Comparaison des performances avec Nvidia
Alors que les discussions autour de l’éthique de l’IA et de sa gestion au sein des entreprises ne cessent de croître, la concurrence entre acteurs technologiques s’intensifie. Intel avec son Gaudi 3 prétend proposer une alternative puissante aux solutions Nvidia. Dans ce contexte, comment les entreprises vont-elles décider quelles technologies intégrer dans leurs systèmes d’IA à long terme ?