GPU-passthrough
Oppdatert: februar 2026 · 7 min lesetid
GPU-passthrough gir en virtuell maskin direkte tilgang til et fysisk grafikkort – med nær null ytelsestap (1–5 %). Kravene er IOMMU-støtte i CPU og BIOS (Intel VT-d / AMD-Vi), en hypervisor som støtter VFIO eller DDA, og et GPU-kort med nok VRAM for oppgaven. Proxmox, ESXi og Hyper-V støtter det alle.
Virtualisering gir fleksibilitet, men standard virtuelle GPU-er er for svake til AI-inferens, 3D-rendering eller video-transkoding. GPU-passthrough løser dette: én VM får eksklusiv tilgang til et fysisk GPU-kort via IOMMU, som om kortet satt direkte i en dedikert maskin.
Hva er GPU-passthrough
Normalt deler alle VM-er en emulert GPU med begrenset ytelse. Med passthrough (også kalt VFIO i Linux-verdenen) får én VM direkte DMA-tilgang til GPU-en via IOMMU. Ytelsen er 95–100 % av bare metal. Kortet er utilgjengelig for andre VM-er så lenge det er tildelt.
Alternativet er vGPU (Nvidia GRID), der flere VM-er deler én GPU via tidsdeling. vGPU krever Nvidia-lisens og gir lavere ytelse per VM, men lar deg betjene flere brukere. For de fleste SMB-er med én til tre GPU-krevende oppgaver er full passthrough enklere og billigere.
Krav til maskinvare
Tre ting må være på plass:
1. CPU med IOMMU: Intel VT-d (alle Xeon Scalable) eller AMD-Vi (alle EPYC). Må aktiveres i BIOS – noen systemer har det deaktivert som standard.
2. BIOS-innstillinger: Aktiver VT-d/AMD-Vi, SR-IOV og eventuelt PCIe ACS (Access Control Services). ACS sikrer at hver PCIe-enhet får sin egen IOMMU-gruppe, slik at du kan tildele GPU-en uten å måtte gi fra deg andre enheter i samme gruppe.
3. GPU med nok VRAM: Se tabellen under. VRAM kan ikke deles – hele kortet går til én VM.
Velg riktig GPU
| GPU | VRAM | TDP | Passer til |
|---|---|---|---|
| Quadro P4000 | 8 GB GDDR5 | 105 W | CAD, design, VDI |
| Quadro P5000 | 16 GB GDDR5 | 180 W | Rendering, VFX |
| Tesla T4 | 16 GB GDDR6 | 70 W | AI-inferens, transkoding |
| RTX A4000 | 16 GB GDDR6 | 140 W | Allrounder: AI + rendering |
| RTX A5000 | 24 GB GDDR6 | 230 W | Store modeller, tung rendering |
Tesla T4 trekker bare 70 W (passiv kjøling), har 16 GB VRAM og støtter INT8/FP16 for effektiv inferens. På bruktmarkedet er den ofte det beste forholdet mellom pris, strøm og VRAM for AI-oppgaver i en server.
Hypervisor-støtte
| Hypervisor | Teknologi | Merknad |
|---|---|---|
| Proxmox VE | VFIO (vfio-pci) | KVM-basert. Beste dokumentasjon. Gratis. |
| VMware ESXi | vDGA | Full GPU til én VM. Krever lisens. |
| Hyper-V | DDA | Discrete Device Assignment. Windows Server. |
Proxmox-oppsett i korte trekk
Proxmox er den vanligste plattformen for GPU-passthrough i SMB-segmentet fordi den er gratis og har god dokumentasjon. Her er hovedstegene:
-
Aktiver IOMMU i GRUB: Legg til
intel_iommu=on iommu=pti/etc/default/grubog kjørupdate-grub. -
Last VFIO-moduler: Legg til
vfio vfio_pci vfio_iommu_type1i/etc/modules. -
Blokker vert-drivere: Hindre at Proxmox-verten bruker GPU-en ved å blackliste
nouveauognvidia. - Sjekk IOMMU-grupper: Verifiser at GPU-en er i en egen gruppe. Hvis den deler gruppe med andre enheter, må du enten flytte kortet til en annen PCIe-slot eller bruke ACS override.
- Konfigurer VM: Bruk q35 maskintype, OVMF (UEFI), og legg til GPU-en som PCIe-enhet. Nvidia-kort har to funksjoner (video + lyd) – begge må tildeles.
- Installer drivere i VM: Standard Nvidia-drivere fungerer. Siden driver v465+ er Code 43-problemet på forbruker-kort løst.
Bruksområder
VDI (virtuelle skrivebord): Gi én eller flere brukere GPU-akselererte skrivebord for CAD, design eller videoredigering. Med passthrough får én bruker hele kortet. For flere brukere per GPU, vurder vGPU.
AI-inferens: Kjør modeller lokalt (LLM, bildegjenkjenning, talesyntese) på en GPU inne i en VM. Tesla T4 med 16 GB VRAM håndterer de fleste inferensoppgaver. For større modeller trengs 24+ GB VRAM.
3D-rendering: Arkitekturvisualisering, VFX eller produktdesign. Quadro- og RTX A-serien har ISV-sertifiserte drivere for profesjonell programvare (Autodesk, Adobe, DaVinci Resolve).
Videotranskoding: NVENC-motoren i Nvidia-kort håndterer HW-akselerert transkoding (H.264/H.265). Tesla T4 er spesielt populær for denne oppgaven fordi den har lavt strømforbruk og passiv kjøling.
Vanlige fallgruver
IOMMU-grupper: GPU-en kan dele IOMMU-gruppe med andre PCIe-enheter. Da må du tildele alle enheter i gruppen til samme VM – eller flytte GPU-en til en annen slot. Dell PowerEdge-servere har generelt bedre IOMMU-gruppeisolasjon enn forbruker-hovedkort, noe som gjør passthrough enklere. ACS override-patchen løser gruppeproblemer i programvare, men bryter maskinvareisolering og bør kun brukes i hjemmelab – aldri i produksjon.
AMD reset-bug: Noen AMD GPU-er (og eldre Nvidia Kepler/Maxwell) klarer ikke å resette seg etter at VM-en stoppes. Løsning: restart hele verten. Nyere kort (Pascal og nyere fra Nvidia) har ikke dette problemet.
Strømforsyning: GPU-er med høy TDP (200+ W) krever at serveren har nok strømkapasitet og 8-pins PCIe-strømkontakter. Dell PowerEdge-servere med GPU enablement kit har dette, men sjekk at PSU-ene er store nok – spesielt med flere GPU-er.
BIOS-lås: Noen servere krever at GPU-støtte aktiveres eksplisitt i BIOS (Dell kaller det «GPU Enablement»). Sjekk også at PCIe-sloten er satt til x16 og ikke delt.
Axentra leverer servere med GPU-kort ferdig installert og testet for passthrough. Dell R740 og R7920 støtter opptil tre dobbeltbredde-GPU-er. HPE ML350 G10 (tårnmodell) støtter opptil fire dobbeltbredde-GPU-er – mest av alle i denne klassen. Trenger du GPU separat? Se GPU-utvalget. Servere finnes i serverutvalget.
Ofte stilte spørsmål
Kan jeg bruke forbruker-GPU (GeForce) for passthrough?
Ja, fra Nvidia-driver v465+ fungerer GeForce-kort i VM uten Code 43-feil. Begrensningen er at GeForce-kort mangler ISV-sertifisering og ECC VRAM. For hjemmelab: helt greit. For produksjon: velg Quadro eller RTX A-serien.
Hvor mye VRAM trenger jeg for AI?
For inferens med mellomstore modeller (7B-parametere): 8–16 GB. For større modeller (13B+) eller trening: 24+ GB. Modellstørrelsen i VRAM avhenger av kvantisering – en 7B-modell i Q4 trenger ca. 4 GB, i FP16 ca. 14 GB.
Kan flere VM-er dele én GPU?
Ikke med passthrough – der får én VM hele kortet. For deling trenger du Nvidia vGPU (GRID), som krever lisens. Alternativt: bruk flere fysiske GPU-er og tildel én per VM.
Fungerer GPU-passthrough med Windows og Linux?
Ja, begge. Windows krever UEFI-boot (OVMF) for best resultat. Linux fungerer både med BIOS og UEFI. Nvidia-drivere er tilgjengelige for begge plattformer.
Hva er forskjellen på vDGA og vSGA i VMware?
vDGA gir én VM hele GPU-en (tilsvarer passthrough). vSGA deler GPU-en mellom flere VM-er via tidsslicing. vDGA gir best ytelse; vSGA gir bedre utnyttelse med mange brukere.
Kan jeg flytte en VM med GPU-passthrough mellom verter?
Ikke live (vMotion/migration). GPU-passthrough binder VM-en til en spesifikk fysisk enhet. For å flytte må du stoppe VM-en, frigjøre GPU-en, flytte VM-en og tildele en GPU på den nye verten.
Trenger jeg spesielle kabler for GPU i server?
De fleste server-GPU-er (Tesla T4, Quadro P4000) bruker kun PCIe-strøm fra sloten eller en 6/8-pins kontakt internt i serveren. Du trenger ikke ekstern skjermkabel med mindre du vil ha lokal skjermutgang fra VM-en.
Neste steg
Sjekk at serveren har IOMMU-støtte (VT-d) aktivert i BIOS, velg en GPU med riktig VRAM for oppgaven, og følg Proxmox-dokumentasjonen for VFIO-oppsett. For AI-inferens er Tesla T4 et rimelig og strømgjerrig førstevalg. For rendering og VDI gir Quadro P4000/P5000 god verdi på bruktmarkedet.