
Ampere est présenté : Nvidia dévoile un GPU monstre pour les serveurs et l'IA

Nvidia a enfin dévoilé l'architecture Ampere sur laquelle elle prévoit de baser ses futures cartes graphiques. Si une carte grand public n'est pas pour demain, la nouvelle puce A100 pour serveurs et supercalculateurs permet d'entrevoir l'avenir.
Ampere représente, selon Nvidia, un saut important par rapport à l'architecture Turing : les nouvelles puces A100 sont basées sur un processus de gravure en 7 nm et sont jusqu'à vingt fois plus rapides que les Tesla V100, le produit phare actuel du constructeur dans cette catégorie.
Les consommateurs ordinaires devront s'armer de patience
Nvidia a officiellement présenté son architecture de GPU Ampere de nouvelle génération lors d'une keynote enregistrée. Le GPU A100 est conçu pour le cloud computing, l'intelligence artificielle et le traitement des nombres scientifiques. Il sera d'abord disponible pour les serveurs et les supercalculateurs. Comme on pouvait s'y attendre, la keynote GTC ne porte pas sur les cartes graphiques grand public. Vous devrez attendre un peu avant de voir une GeForce RTX 3080 sur votre ordinateur.

Selon la société, l'A100 représente le plus grand saut générationnel de GPU depuis longtemps, avec une vitesse 20 fois supérieure à la solution précédente basée sur Volta et des cœurs Tensor de troisième génération. L'A100 est une bête de silicium avec 54 milliards de transistors et 6912 cœurs CUDA. A titre de comparaison, le produit phare actuel des cartes grand public GeForce 2080 Ti compte 4352 cœurs CUDA. Comme prévu, le nouveau GPU Ampere de Nvidia est basé sur un processus de gravure en 7 nm.
Pour Nvidia, le principal avantage de cette nouvelle puce est la réduction des coûts pour les grands centres de données. Selon le fabricant, un système qui coûte aujourd'hui 11 millions de dollars et nécessite 25 armoires de serveurs et 630 KW de puissance devrait pouvoir être remplacé par un système Ampere qui tient dans une seule armoire, coûte un million de dollars et nécessite 28 KW de puissance.

Le PDG de Nvidia, Jensen Huang, sort lui-même un tel système du four lors de sa présentation - la keynote a été enregistrée dans la cuisine du domicile de Huang. La monstrueuse carte mère HGX de Nvidia est une pièce d'ingénierie impressionnante. Elle contient huit GPU A100, 30 000 autres composants et un kilomètre de circuits imprimés. Cela en fait l'une des cartes mères les plus complexes qui existent. La carte est utilisée dans le système DGX A100 de Nvidia. Selon le fabricant, cela fournit 5 pétaflops de puissance de calcul d'IA et 320 Go de mémoire GPU avec 12,4 TB par seconde de bande passante dans un boîtier relativement petit.
Qu'est-ce que cela signifie maintenant pour la prochaine génération de GeForce?
Huang a ensuite dit quelques mots sur la génération de cartes graphiques GeForce basée sur Ampere. La configuration de la puce est légèrement différente. L'A100 a été conçue pour effectuer des calculs en virgule flottante avec une précision deux fois supérieure. Les GPU Ampere orientés vers le consommateur seront axés sur le graphisme et moins sur le calcul.
La keynote GTC 2020 et les communiqués de presse ne révèlent pas grand-chose sur les fréquences d'horloge. Mais ce qui est clair, c'est que les cartes Ampere supporteront le PCIe 4.0 et que le passage à la gravure en 7 nm permettra à Nvidia d'utiliser beaucoup plus de cœurs RT pour améliorer les performances de ray tracing. La prochaine génération de cartes grand public devrait donc bénéficier d'une nette amélioration des performances. Il faudra attendre quelques mois pour savoir à quel point, lorsque Nvidia présentera officiellement sa nouvelle gamme GeForce.
Engadget a résumé la keynote en dix minutes. Vous trouverez ici l'intégralité de la keynote à revoir.


La technologie et la société me fascinent. Combiner les deux et les regarder sous différents angles est ma passion.