NVIDIA A100 40GB PCIe er en kraftig datacenter-GPU for AI, maskinlæring og HPC-beregninger. Ampere-arkitekturen leverer høy ytelse for både AI-modeller og vitenskapelige arbeidslaster.
Dette er bestillingsvare, og noe leveringstid må påregnes.
AI- og HPC-ytelse i datacenter
NVIDIA A100 er en av de mest etablerte GPU-ene i moderne AI-infrastruktur. Kortet bygger på Ampere-arkitekturen og er utviklet for tunge beregningsoppgaver som maskinlæring, LLM-inferens, dataanalyse og vitenskapelige simuleringer.
GPU-en leverer høy ytelse for FP64, FP32, TF32 og FP16, noe som gjør den egnet både til AI-trening, inferens og klassiske HPC-arbeidslaster.
40 GB HBM2-minne
Kortet er utstyrt med 40 GB HBM2-minne og opptil 1 555 GB/s minnebåndbredde. Dette gir svært rask dataflyt mellom minne og GPU-kjerner, noe som er avgjørende for AI-arbeidslaster med store datasett.
40 GB-versjonen gir et godt kompromiss mellom kapasitet og kostnad for mange inferens- og treningsoppgaver.
PCIe Gen4 og bred serverkompatibilitet
PCIe-versjonen av A100 kan installeres direkte i standard servere med fullhøyde PCIe-slot. GPU-en bruker PCIe Gen4 x16, som gir høy båndbredde og kompatibilitet med de fleste moderne serverplattformer.
Kortet passer blant annet i systemer som Dell PowerEdge R740, R740xd, R7920 og HPE DL380 Gen10, og gjør det mulig å bygge kraftige AI-noder uten spesialisert HGX-baseboard.
Multi-Instance GPU
A100 støtter Multi-Instance GPU (MIG), som gjør det mulig å dele GPU-en opp i opptil syv isolerte instanser. Hver instans kan kjøre egne arbeidslaster, noe som gjør GPU-en ideell for miljøer med flere brukere eller tjenester.
I MIG-modus kan GPU-en deles i opptil 7 instanser på rundt 5 GB hver, med isolerte ressurser og forutsigbar ytelse.
Kjøling og serverkrav
A100 40GB PCIe har et 250 W TDP og bruker passiv kjøling. Kortet er designet for rackservere med god luftgjennomstrømning og monteres som et dobbelslot fullhøyde PCIe-kort.
For høyere GPU-til-GPU-båndbredde kan to A100 PCIe-kort kobles sammen via NVLink Bridge, noe som gir delt minne og betydelig raskere kommunikasjon mellom GPU-ene.
Stand og levering
GPU-en er brukt og profesjonelt testet før levering for å sikre stabil drift i servermiljøer.
Passer godt til: AI-inferens, maskinlæring, GPU-akselerert dataanalyse, forskningsmiljøer, HPC-simuleringer og GPU-noder i datasenter.