Aujourd’hui, nous sommes ravis d’annoncer Azure Cobalt 200, notre CPU Arm de nouvelle génération conçu pour les charges de travail cloud natives.
Cobalt 200 marque une étape importante dans notre approche continue visant à optimiser chaque couche de la pile cloud, du silicium au logiciel. Nos objectifs de conception étaient d’assurer une compatibilité totale avec les charges de travail utilisant nos processeurs Azure Cobalt existants, d’offrir une amélioration des performances pouvant atteindre 50 % par rapport à Cobalt 100 et d’intégrer les dernières technologies Microsoft en matière de sécurité, de mise en réseau et de stockage.
Comme son prédécesseur, Cobalt 200 est optimisé pour les charges de travail courantes des clients et offre des capacités uniques pour nos propres produits cloud Microsoft. Nos premiers serveurs Cobalt 200 sont désormais opérationnels dans nos centres de données, et leur déploiement à plus grande échelle et leur mise à disposition pour les clients sont prévus pour 2026.
SoC et plateforme Azure Cobalt 200
Notre aventure Azure Cobalt a commencé avec Cobalt 100, notre premier processeur sur mesure pour les charges de travail cloud natives. Les machines virtuelles Cobalt 100 sont disponibles depuis octobre 2024 et leur disponibilité s’est rapidement étendue à 32 régions de centres de données Azure à travers le monde.
En seulement un an, nous avons été impressionnés par la rapidité avec laquelle les clients ont adopté la nouvelle plateforme et migré leurs charges de travail les plus critiques vers Cobalt 100 pour bénéficier de ses performances, de son efficacité et de son rapport qualité-prix.
Les leaders de l’analyse cloud tels que Databricks et Snowflake adoptent Cobalt 100 pour optimiser leur empreinte cloud. L’équilibre entre les performances de calcul et l’efficacité énergétique des machines virtuelles et des conteneurs basés sur Cobalt 100 s’est avéré idéal pour les charges de travail de traitement de données à grande échelle.
Les services cloud de Microsoft ont également rapidement adopté Azure Cobalt pour bénéficier d’avantages similaires. Microsoft Teams a obtenu des performances jusqu’à 45 % supérieures avec Cobalt 100 par rapport à sa plateforme de calcul précédente. Cette augmentation des performances signifie que moins de serveurs sont nécessaires pour effectuer la même tâche. Par exemple, le traitement multimédia de Microsoft Teams utilise 35 % de cœurs de calcul en moins avec Cobalt 100.
Forts de cette base solide, nous avons entrepris de concevoir un digne successeur : Cobalt 200.
Nous avons été confrontés à un défi majeur : les benchmarks informatiques traditionnels ne reflètent pas la diversité des charges de travail de nos clients. Notre télémétrie provenant d’un large éventail de charges de travail exécutées dans Azure (des petits microservices aux produits SaaS disponibles à l’échelle mondiale) ne correspondait pas aux benchmarks de performances matérielles courants. Les benchmarks existants ont tendance à privilégier les modèles de calcul axés sur les cœurs de processeur, laissant ainsi des lacunes dans la manière dont les applications cloud réelles se comportent à grande échelle lorsqu’elles utilisent des ressources réseau et de stockage. L’optimisation d’Azure Cobalt pour les charges de travail des clients nous oblige à aller au-delà de ces benchmarks axés sur les cœurs de processeur afin de vraiment comprendre et modéliser la diversité des charges de travail des clients dans Azure.
Nous avons donc créé un portefeuille de benchmarks directement inspirés des modèles d’utilisation que nous observons dans Azure, notamment les bases de données, les serveurs web, les caches de stockage, les transactions réseau et l’analyse de données. Chacune de nos charges de travail de benchmark comprend plusieurs variantes pour l’évaluation des performances en fonction de la manière dont nos clients peuvent utiliser la base de données, le stockage ou la technologie de serveur web sous-jacente. Au total, nous avons créé et affiné plus de 140 variantes de benchmark individuelles dans le cadre de notre suite d’évaluation interne.
Avec l’aide de nos équipes logicielles, nous avons créé une simulation numérique complète à partir du silicium : en commençant par la microarchitecture du cœur du processeur, la structure et les blocs IP de mémoire dans Cobalt 200, jusqu’à la conception du serveur et la topologie du rack. Nous avons ensuite utilisé l’IA, la modélisation statistique et la puissance d’Azure pour modéliser les performances et la consommation électrique des 140 benchmarks par rapport à 2 800 combinaisons de paramètres de conception du SoC et du système : nombre de cœurs, taille du cache, vitesse de la mémoire, topologie du serveur, puissance du SoC et configuration du rack.
Cela a abouti à l’évaluation de plus de 350 000 configurations candidates du système Cobalt 200 dans le cadre de notre processus de conception. Cette modélisation et cette simulation approfondies nous ont aidés à itérer rapidement pour trouver le point de conception optimal pour Cobalt 200, offrant des performances accrues de plus de 50 % par rapport à Cobalt 100, tout en continuant à fournir notre plateforme la plus économe en énergie dans Azure.
Azure Cobalt 200 SoC
Au cœur de chaque serveur Cobalt 200 se trouve le silicium de calcul le plus avancé d’Azure : le système sur puce (SoC) Cobalt 200. Le Cobalt 200 SoC est construit autour de l’Arm Neoverse Compute Subsystems V3 (CSS V3), le dernier cœur et la dernière structure optimisés pour les performances d’Arm. Chaque Cobalt 200 SoC comprend 132 cœurs actifs avec 3 Mo de cache L2 par cœur et 192 Mo de cache système L3 pour offrir des performances exceptionnelles pour les charges de travail des clients.
L’efficacité énergétique est tout aussi importante que les performances brutes. La consommation d’énergie représente une part importante du coût d’exploitation à vie d’un serveur cloud. L’une des innovations uniques de nos processeurs Azure Cobalt est le Dynamic Voltage and Frequency Scaling (DVFS) individuel par cœur. Dans Cobalt 200, cela permet à chacun des 132 cœurs de fonctionner à un niveau de performance différent, offrant une consommation d’énergie optimale quelle que soit la charge de travail. Nous tirons également parti du dernier processus TSMC 3 nm, qui améliore encore l’efficacité énergétique.
Schéma de l’architecture SoC Azure Cobalt 200
La sécurité est une priorité pour tous nos clients et un élément clé de l’innovation unique de Cobalt 200. Nous avons conçu et construit un contrôleur de mémoire personnalisé pour Cobalt 200, afin que le chiffrement de la mémoire soit activé par défaut avec un impact négligeable sur les performances. Cobalt 200 implémente également l’architecture de calcul confidentiel (CCA) d’Arm, qui prend en charge l’isolation matérielle de la mémoire VM de l’hyperviseur et du système d’exploitation hôte.
Lors de la conception du Cobalt 200, nos charges de travail de référence et nos simulations de conception ont révélé une tendance intéressante : plusieurs modèles de calcul universels ont émergé, à savoir la compression, la décompression et le chiffrement. Plus de 30 % des charges de travail dans le cloud utilisaient de manière significative l’une de ces opérations courantes.
L’optimisation de ces opérations courantes nécessitait une approche différente de la simple dimensionnement du cache et sélection des cœurs de processeur. Nous avons conçu des accélérateurs de compression et de cryptographie personnalisés, des blocs de silicium dédiés sur chaque SoC Cobalt 200, dans le seul but d’accélérer ces opérations sans sacrifier les cycles du processeur. Ces accélérateurs contribuent à réduire la consommation du processeur par les charges de travail et les coûts globaux. Par exemple, en déchargeant les tâches de compression et de chiffrement vers l’accélérateur Cobalt 200, Azure SQL est en mesure de réduire l’utilisation des ressources informatiques critiques, en les réservant en priorité aux charges de travail des clients.
Azure Cobalt est plus qu’un simple SoC, et nous optimisons et accélérons en permanence chaque couche de l’infrastructure.
Les dernières fonctionnalités Azure Boost sont intégrées au nouveau système Cobalt 200, ce qui améliore considérablement les performances du réseau et du stockage à distance. Azure Boost offre une bande passante réseau accrue et décharge les tâches de stockage à distance et de mise en réseau vers du matériel personnalisé, améliorant ainsi les performances globales de la charge de travail et réduisant la latence.
Les systèmes Cobalt 200 intègrent également le module HSM (Hardware Security Module) intégré à Azure, qui offre aux clients une protection de haut niveau des clés cryptographiques au sein de l’infrastructure Azure, garantissant ainsi la sécurité des données sensibles. Le module HSM intégré à Azure fonctionne avec Azure Key Vault pour simplifier la gestion des clés de chiffrement, offrant une haute disponibilité et une grande évolutivité, tout en respectant la norme FIPS 140-3 niveau 3.
Un serveur Azure Cobalt 200 dans un laboratoire de validation
Nous sommes enthousiasmés par l’innovation et la technologie avancée du Cobalt 200 et avons hâte de voir comment nos clients créeront des produits et services révolutionnaires. Nous sommes occupés à installer et à empiler des serveurs Cobalt 200 dans le monde entier et nous avons hâte de vous en dire plus à l’approche de leur mise à disposition à plus grande échelle l’année prochaine.
Découvrez le discours d’ouverture de Microsoft Ignite
En savoir plus sur les nouveautés Azure présentées à Ignite
En savoir plus sur l’infrastructure mondiale de Microsoft
Source de l’article


