NVIDIA Ampere A100 250W TDP GPU på PCIe 4.0 Laget for AI, datavitenskap og superdatamaskin lansert med lovet ytelse på 90 prosent av 400W-modellen

NVIDIA har offisielt lansert A100, en PCIe 4.0-kompatibel GPU basert på neste generasjons Ampere-arkitektur. Selv om den har en lavere 250 W TDP-profil, lover NVIDIA at PCIe 4.0 Ampere A100 GPU vil kunne tilby opptil 90 prosent av ytelsen til hele 400 W A100 HGX GPU. Den tredje varianten til den voksende Ampere A100 GPU-familien, A100 PCIe, er ment for servere som kjører Artificial Intelligence (AI), Data Science og Supercomputing-klynger.

NVIDIA avslørte en PCI-Express 4.0-variant av A100 GPU. GPU er basert på 7nm Ampere mikroarkitektur. I tillegg kunngjorde selskapet flere A100-drevne systemer fra ledende serverprodusenter, inkludert Asus, Dell, Cisco, Lenovo og mer. 250W A100 PCIe 4.0 GPU-akseleratoren er ganske lik den komplette 400W TDP-varianten, og NVIDIA lover også nesten identisk ytelse til tross for det betydelige fallet i TDP-profilen.

NVIDIA A100 Ampere GPU In PCIe 4.0 Form-Factor With Same 400W A100 HGX GPU Configuration But at 250W:

NVIDIA har kunngjort sin PCIe 4.0 A100 PCIe GPU-akselerator. Ampere GPU er tilgjengelig for et mangfoldig sett med industrielle bruksområder med systemer som spenner fra en enkelt A100 PCIe GPU til servere som bruker to kort samtidig gjennom de 12 NVLINK-kanalene som leverer totalt 600 GB / s med sammenkoblet båndbredde. 250W TDP A100 PCIe GPU-akselerator endres ikke mye når det gjelder kjernekonfigurasjon sammenlignet med 400W A100 HGX GPU.

https://twitter.com/storagereview/status/1275132949709688833

GA100 GPU har spesifikasjonene for 400W A100 HGX-varianten med 6912 CUDA-kjerner arrangert i 108 SM-enheter, 432 Tensor Cores og 40 GB HBM2-minne som gir samme minnebåndbredde på 1,55 TB / s (avrundet til 1,6 TB / s). Imidlertid distribuere GPU-pakken på PCIe 4.0 standard hadde sin egen ulempe med å redusere TDP betydelig. Dette betyr angivelig en ytelsesstraff på 10 til 50 prosent basert på arbeidsmengden. Videre er 250 W TDP-varianten av A100 GPU mer egnet for korte utbrudd i stedet for vedvarende belastninger.

NVIDIA A100 Ampere GPU i PCIe 4.0 formfaktorytelse:

På grunn av den betydelige reduksjonen i TDP-profilen, kan det antas at kortet vil ha lavere klokker for å kompensere for mindre TDP-inngang. Imidlertid er ytelsesberegningene som NVIDIA har gitt ut, virkelig overraskende da de kommer ganske nær 400W TDP-varianten. FP64-ytelsen er fremdeles vurdert til 9,7 / 19,5 TFLOPs, FP32-ytelsen er rangert til 19,5 / 156/312 TFLOPs (Sparsity), FP16-ytelsen er vurdert til 312/624 TFLOPs (Sparsity), og INT8 er vurdert til 624/1248 TOPs ( Sparsity).

Enkel matematikk indikerer, og NVIDIA forsikrer at Ampere-basert PCIe 4.0 250W A100 GPU kan levere 90 prosent av ytelsen til A100 HGX-kortet (400W) i toppserverapplikasjoner. Dette er forsvarlig fordi det tar kortere tid for den nye varianten å fullføre ovennevnte oppgaver. Tallene skal imidlertid bare være gyldige for korte intervaller. I komplekse situasjoner som krevde vedvarende GPU-evner, kan 250 W PCIe 4.0 GPU levere alt fra opptil 90 prosent til ned til 50 prosent ytelsen til 400 W A100 HGX GPU.

Ampere-mikroarkitekturen vil helt sikkert være til nytte for den nye A100. NVIDIA lover minst en 20X ytelsesforbedring over den Volta-baserte forgjengeren. PCIe 4.0 A100 GPU har GPU med flere instanser. Dette betyr at en enkelt A100 kan deles inn i så mange som syv separate GPUer for å håndtere forskjellige databehandlingsoppgaver. Mens dette øker segmenteringen, er det 3. generasjons NVLink, som gjør det mulig å knytte flere GPUer til en gigantisk GPU.