Microsoft a franchi une étape significative en dévoilant sa nouvelle initiative : la création de ses propres processeurs basés sur la technologie Arm. Ces puces sur mesure visent à réduire la dépendance de l’entreprise envers des fournisseurs externes tels que Nvidia, positionnant ainsi Microsoft comme un acteur majeur dans le secteur de l’IA et du cloud.
Les rumeurs deviennent réalité
Les spéculations circulaient depuis un certain temps sur le « Projet Athena » de Microsoft, un effort visant à développer des puces personnalisées pour ses centres de données. Ces rumeurs ont été confirmées cette semaine lors de la conférence Ignite 2023, où Microsoft a dévoilé deux processeurs innovants basés sur la technologie Arm.
Microsoft Azure Maia 100 AI Accelerator : puissance dédiée à l’IA
La première puce, nommée Microsoft Azure Maia 100 AI Accelerator, est le fruit du projet Athena. Conçue pour gérer des charges de travail IA spécifiques, cette puce est destinée à être intégrée dans les fermes de serveurs Azure à partir de 2024. Elle se distingue par sa capacité à exécuter des modèles de langages volumineux tels que GPT-3.5 Turbo et GPT-4. Construite sur le processus 5 nm de TSMC, elle compte pas moins de 105 milliards de transistors. La Maia 100 prend en charge divers formats de données MX, offrant des temps de formation et d’inférence plus rapides grâce à des transistors optimisés.
Il est intéressant de noter que Microsoft a collaboré étroitement avec OpenAI pour le développement de cette puce, tirant parti des commentaires de cette dernière pour optimiser l’efficacité de l’architecture d’IA d’Azure.
Processeur Cobalt 100 : améliorations de performance pour le cloud Azure
La deuxième puce dévoilée, le processeur Cobalt 100, est un processeur Arm 64 bits à 128 cœurs, basé sur les sous-systèmes de calcul Arm Neoverse. Cette puce vise à améliorer les performances des charges de travail informatiques générales dans le cloud Azure, avec des améliorations atteignant jusqu’à 40 % par rapport aux générations précédentes. Ces serveurs basés sur Cobalt 100 alimenteront des services tels que Microsoft Teams et Windows 365.
Rani Borkar, responsable des systèmes d’infrastructure Azure chez Microsoft, souligne que ces puces sont le fruit de deux décennies d’expérience dans la co-ingénierie du silicium pour les produits Xbox et Surface.
Coûts et infrastructures
L’aspect coût est une considération majeure dans cette entreprise. Pour la Maia 100 AI Accelerator, Microsoft a dû concevoir une nouvelle solution de refroidissement liquide et une nouvelle conception de rack, mais le coût d’utilisation reste inférieur à celui des matériels spécialisés de Nvidia ou d’AMD.
Cela représente une avancée significative pour Microsoft dans la maîtrise des performances et de la consommation d’énergie par cœur, renforçant sa position dans le marché des puces pour centres de données.
L’Avenir de microsoft dans le secteur de l’IA et du cloud
Microsoft a clairement exprimé sa volonté d’étendre l’intégration de l’IA à tous ses services, comme en témoigne la sortie de Copilot pour diverses plateformes. La création de silicium personnalisé positionne l’entreprise pour relever les défis croissants liés à la formation et à l’inférence en matière d’IA, tout en offrant une diversité dans sa chaîne d’approvisionnement.
Bien que Microsoft continue à utiliser du matériel disponible dans le commerce, cette avancée technologique démontre son engagement envers l’innovation et la recherche de solutions plus rentables dans le domaine de l’IA et du cloud.