Hva er NVLink – og hvorfor betyr det noe i AI-servere

Oppdatert: mars 2026 · 7 min lesetid

Kort oppsummert

NVLink er NVIDIAs høyhastighetskobling mellom GPU-er. I praksis betyr det at flere GPU-er i samme server kan utveksle data langt raskere enn over vanlig PCIe. Dette er viktig i AI-servere fordi store modeller ofte må fordeles over flere GPU-er. Uten rask GPU-til-GPU-kommunikasjon forsvinner mye av gevinsten ved å ha mange kraftige kort. Kort sagt: NVLink er en av hovedgrunnene til at en ekte 4- eller 8-GPU AI-server oppfører seg helt annerledes enn en vanlig server med flere løse PCIe-kort.

Mange ser på antall GPU-er og antar at flere alltid betyr lineært mer ytelse. Slik fungerer det ikke. Når flere GPU-er skal samarbeide om én stor AI-arbeidslast, blir kommunikasjonen mellom dem en kritisk flaskehals.

Det er her NVLink kommer inn. I en vanlig server med flere PCIe-kort må GPU-ene i stor grad snakke sammen over PCIe-bussen. Det fungerer, men båndbredden og latensen er langt svakere enn i en plattform som er bygget for tett GPU-samarbeid. Derfor betyr ikke bare antall GPU-er noe – men hvordan de er koblet sammen.

Illustrasjon av NVLink mellom flere GPU-er i en AI-server
NVLink kobler GPU-er tettere sammen enn vanlig PCIe og er sentralt i tunge AI-servere

NVLink er NVIDIAs høyhastighets interconnect for kommunikasjon mellom GPU-er. Den er laget for at flere GPU-er i samme server skal kunne utveksle data langt raskere og mer effektivt enn over vanlig PCIe.

I praksis gjør NVLink det mulig for GPU-er å samarbeide tettere om store arbeidslaster. Dette er spesielt relevant i AI-trening, der en modell ofte må deles opp over flere GPU-er fordi én enkelt GPU ikke har nok minne eller nok ytelse alene.

Det betyr ikke at NVLink erstatter alt annet i serveren. CPU, RAM, lagring og nettverk er fortsatt viktige. Men når arbeidslasten er GPU-tung og skalerer over flere kort, blir forbindelsen mellom GPU-ene en nøkkelfaktor.

En enkel måte å tenke på det på:

PCIe lar flere GPU-er stå i samme maskin. NVLink lar dem faktisk samarbeide effektivt.

Hvorfor betyr NVLink noe i AI-servere?

Store AI-modeller passer ofte ikke inn i minnet til én enkelt GPU. Derfor må modellen, batchen eller aktiv data fordeles over flere GPU-er. Når det skjer, må GPU-ene sende store datamengder til hverandre hele tiden.

Hvis kommunikasjonen mellom GPU-ene er treg, begynner de å vente på hverandre. Da får du ikke fullt utbytte av å ha mange dyre GPU-er. Ytelsen stopper ikke nødvendigvis opp fullstendig, men den skalerer dårligere enn den burde.

NVLink reduserer denne flaskehalsen. Derfor er den spesielt viktig i:

Trening av store språkmodeller. Når modellen må splittes over flere GPU-er, må lag, vekter eller aktiveringer krysse GPU-grenser raskt.

Store transformer-workloads. Disse har ofte mye intern databevegelse og drar tydelig nytte av rask GPU-til-GPU-kommunikasjon.

Multi-GPU inferens. Også inferens kan dra nytte av tett koblede GPU-er når modellene er store nok eller throughput-kravet er høyt.

GPU-akselerert HPC. Enkelte beregninger utenfor klassisk AI er også svært følsomme for interconnect-hastighet mellom GPU-er.

PCIe er den vanlige bussen som brukes til å koble GPU-er, nettverkskort, NVMe-kontrollere og andre utvidelseskort til serverens hovedkort. Den er fleksibel, moden og nødvendig i nesten alle servere.

NVLink er mer spesialisert. Den er ikke laget for generell utvidelse, men for rask kommunikasjon mellom GPU-er. Derfor blir sammenligningen litt som å sammenligne en vanlig vei med en motorvei som kun er bygget for én type tungtransport.

Egenskap PCIe NVLink
Bruksområde Generell tilkobling av utvidelseskort Høyhastighetskobling mellom GPU-er
Fleksibilitet Høy Lavere, men spesialisert
GPU-til-GPU-kommunikasjon Mulig, men mer begrenset Betydelig raskere og tettere
Typisk bruk i AI-servere Mindre noder, PCIe-baserte oppsett HGX-systemer og tunge multi-GPU-servere
Best for Fleksible serverbygg Store modeller og tett GPU-samarbeid

Det betyr ikke at PCIe er dårlig. Mange AI-workloads kjører helt fint på PCIe-kort. Men hvis målet er å få flere GPU-er til å oppføre seg som én tett integrert AI-plattform, er NVLink en vesentlig del av løsningen.

Hva gir det i praksis?

Den praktiske gevinsten med NVLink er ikke at den gjør alle arbeidslaster raskere. Gevinsten er at arbeidslaster som faktisk trenger tett GPU-samarbeid, skalerer langt bedre.

Bedre skalering over flere GPU-er. Når kommunikasjonen går raskere, mister du mindre ytelse til venting og synkronisering.

Mer effektiv utnyttelse av GPU-minne. Store modeller som må fordeles over flere kort håndteres bedre når GPU-ene kan dele data raskt.

Bedre egnethet for store noder. En 4- eller 8-GPU-server med NVLink er laget for en annen klasse arbeidslaster enn en vanlig server med flere separate PCIe-kort.

Mer forutsigbar ytelse i tunge treningsjobber. Jo mer data som må krysse mellom GPU-er, jo mer verdifull blir rask interconnect.

Sammenligning av skalerbarhet med NVLink og PCIe i multi-GPU servere
NVLink handler først og fremst om bedre skalering og mindre GPU-til-GPU-flaskehalser

Når trenger du NVLink – og når trenger du det ikke?

Det er lett å overdrive hvor viktig NVLink er. Ikke alle AI-prosjekter trenger det.

Du trenger ofte ikke NVLink hvis:

Du kjører mindre modeller. Du finjusterer moderate modeller på én eller få GPU-er. Du bygger inferensnoder der hver GPU jobber relativt uavhengig. Du prioriterer fleksibilitet og lavere kostnad over maksimal multi-GPU-ytelse.

Du bør seriøst vurdere NVLink hvis:

Du trener store språkmodeller. Du vet at arbeidslasten må fordeles over mange GPU-er i samme node. Du vil ha maksimal ytelse per server. Du ser på HGX-baserte plattformer med 4 eller 8 GPU-er for tunge AI- eller HPC-workloads.

Tommelregel:

Hvis du sammenligner én kraftig GPU mot flere tett koblede GPU-er, er NVLink svært relevant. Hvis du sammenligner én eller to GPU-er i en fleksibel server for mindre workloads, er det ofte langt mindre avgjørende.

Hva betyr HGX og baseboard i denne sammenhengen?

Når man snakker om tunge AI-servere med A100 eller H100, dukker ofte begreper som HGX og baseboard opp. Dette er viktig fordi NVLink sjelden er et frittstående tema. Det henger sammen med hele GPU-plattformen.

I en HGX-server er GPU-ene montert på et spesialisert baseboard som er bygget for høy effekt, tett integrasjon og rask GPU-til-GPU-kommunikasjon. Det er denne typen plattform som gjør at en 8-GPU AI-server virkelig fungerer som en samlet treningsnode, ikke bare som en kasse med mange kort.

Det er derfor en server med 8 × H100 eller 8 × A100 på HGX-plattform er noe helt annet enn en standard rackserver med flere PCIe-GPU-er. Antallet GPU-er kan se likt ut på papiret, men internarkitekturen er vesentlig forskjellig.

Ikke sammenlign bare GPU-navn:

En AI-server med HGX, SXM-moduler og NVLink bør vurderes som en egen klasse maskinvare. Den er bygget for maksimal multi-GPU-ytelse, ikke bare for å ha mange PCIe-kort i samme chassis.

NVLink i brukt og rekondisjonert AI-hardware

For mange kjøpere er ikke spørsmålet om de skal bygge nytt, men om de kan få mer ytelse for pengene med rekondisjonert enterprise-hardware. Det er nettopp her NVLink-baserte systemer kan være svært interessante.

En brukt AI-server med flere A100- eller H100-GPU-er på HGX-plattform kan fortsatt levere ekstrem ytelse, så lenge maskinvaren er testet, kjølingen er i orden, og hele systemet er verifisert under belastning. For slike systemer handler kvalitet ikke bare om at serveren starter, men at GPU-er, interconnect, PSU-er, firmware og termisk oppførsel fungerer som de skal.

Når du vurderer en brukt AI-server, bør du derfor ikke bare spørre hvor mange GPU-er den har. Du bør også spørre:

Er dette PCIe eller SXM? Er det HGX-plattform? Har GPU-ene NVLink? Er systemet stresstestet som helhet? Følger det med dokumentasjon på stand og konfigurasjon?

Axentra:

Hos Axentra finner du både PCIe-kort og komplette AI-servere med A100 og H100. For arbeidslaster som krever tett GPU-samarbeid, er servere med HGX-plattform og NVLink langt mer relevante enn et oppsett med flere løse PCIe-kort. Kontakt Axentra hvis du vil ha hjelp til å vurdere riktig plattform for trening eller inferens.

Ofte stilte spørsmål

Er NVLink det samme som PCIe?

Nei. PCIe er en generell buss for tilkobling av utvidelseskort i servere og arbeidsstasjoner. NVLink er en spesialisert høyhastighetskobling for kommunikasjon mellom GPU-er.

Trenger alle AI-servere NVLink?

Nei. Mindre AI-workloads, enklere inferensnoder og mange PCIe-baserte servere fungerer fint uten NVLink. Behovet øker når store modeller må fordeles over flere GPU-er.

Gir NVLink mer GPU-minne?

Ikke direkte. Hver GPU har fortsatt sitt eget minne. Men rask kommunikasjon mellom GPU-ene gjør det langt mer praktisk å fordele store modeller og data over flere kort.

Er NVLink viktig for LLM-trening?

Ja, ofte. Store språkmodeller må ofte deles over flere GPU-er, og da blir rask GPU-til-GPU-kommunikasjon svært viktig for å oppnå god skalering og høy effektivitet.

Er en server med 8 PCIe-GPU-er like god som en 8-GPU HGX-server?

Ikke nødvendigvis. Selv om antallet GPU-er er likt, er internarkitekturen forskjellig. En HGX-server med NVLink er bygget for mye tettere samarbeid mellom GPU-ene.

Er NVLink bare relevant for trening, eller også inferens?

Begge deler. NVLink er særlig viktig i trening av store modeller, men kan også være nyttig i inferensmiljøer der modellene er store eller throughput-kravet er høyt.

Bør jeg velge NVLink eller raskere nettverk mellom servere?

Det er to forskjellige ting. NVLink handler om kommunikasjon mellom GPU-er i samme node. Raskt nettverk som 100GbE eller InfiniBand handler om kommunikasjon mellom flere servere i et cluster. Store AI-miljøer trenger ofte begge deler.

Neste steg

Hvis du vurderer en AI-server for trening eller tung inferens, bør du ikke bare se på GPU-modell og minnemengde. Se også på hvordan GPU-ene er koblet sammen. Det er ofte her den store forskjellen mellom “mange GPU-er” og “en ekte AI-server” ligger.

Axentra leverer både AI-kort og komplette servere med A100 og H100. Kontakt Axentra for spørsmål ved kjøp