GPU-passthrough

Oppdatert: februar 2026 · 7 min lesetid

Kort oppsummert

GPU-passthrough gir en virtuell maskin direkte tilgang til et fysisk grafikkort – med nær null ytelsestap (1–5 %). Kravene er IOMMU-støtte i CPU og BIOS (Intel VT-d / AMD-Vi), en hypervisor som støtter VFIO eller DDA, og et GPU-kort med nok VRAM for oppgaven. Proxmox, ESXi og Hyper-V støtter det alle.

Virtualisering gir fleksibilitet, men standard virtuelle GPU-er er for svake til AI-inferens, 3D-rendering eller video-transkoding. GPU-passthrough løser dette: én VM får eksklusiv tilgang til et fysisk GPU-kort via IOMMU, som om kortet satt direkte i en dedikert maskin.

GPU-passthrough: fysisk GPU tildelt direkte til en virtuell maskin via IOMMU
IOMMU kobler GPU-en direkte til VM-en. Hypervisoren styrer CPU og RAM, men GPU-trafikken går utenfor.

Hva er GPU-passthrough

Normalt deler alle VM-er en emulert GPU med begrenset ytelse. Med passthrough (også kalt VFIO i Linux-verdenen) får én VM direkte DMA-tilgang til GPU-en via IOMMU. Ytelsen er 95–100 % av bare metal. Kortet er utilgjengelig for andre VM-er så lenge det er tildelt.

Alternativet er vGPU (Nvidia GRID), der flere VM-er deler én GPU via tidsdeling. vGPU krever Nvidia-lisens og gir lavere ytelse per VM, men lar deg betjene flere brukere. For de fleste SMB-er med én til tre GPU-krevende oppgaver er full passthrough enklere og billigere.

Krav til maskinvare

Tre ting må være på plass:

1. CPU med IOMMU: Intel VT-d (alle Xeon Scalable) eller AMD-Vi (alle EPYC). Må aktiveres i BIOS – noen systemer har det deaktivert som standard.

2. BIOS-innstillinger: Aktiver VT-d/AMD-Vi, SR-IOV og eventuelt PCIe ACS (Access Control Services). ACS sikrer at hver PCIe-enhet får sin egen IOMMU-gruppe, slik at du kan tildele GPU-en uten å måtte gi fra deg andre enheter i samme gruppe.

3. GPU med nok VRAM: Se tabellen under. VRAM kan ikke deles – hele kortet går til én VM.

Velg riktig GPU

GPU VRAM TDP Passer til
Quadro P4000 8 GB GDDR5 105 W CAD, design, VDI
Quadro P5000 16 GB GDDR5 180 W Rendering, VFX
Tesla T4 16 GB GDDR6 70 W AI-inferens, transkoding
RTX A4000 16 GB GDDR6 140 W Allrounder: AI + rendering
RTX A5000 24 GB GDDR6 230 W Store modeller, tung rendering
Tesla T4 – et godt kjøp brukt:

Tesla T4 trekker bare 70 W (passiv kjøling), har 16 GB VRAM og støtter INT8/FP16 for effektiv inferens. På bruktmarkedet er den ofte det beste forholdet mellom pris, strøm og VRAM for AI-oppgaver i en server.

Hypervisor-støtte

Hypervisor Teknologi Merknad
Proxmox VE VFIO (vfio-pci) KVM-basert. Beste dokumentasjon. Gratis.
VMware ESXi vDGA Full GPU til én VM. Krever lisens.
Hyper-V DDA Discrete Device Assignment. Windows Server.

Proxmox-oppsett i korte trekk

Proxmox er den vanligste plattformen for GPU-passthrough i SMB-segmentet fordi den er gratis og har god dokumentasjon. Her er hovedstegene:

  1. Aktiver IOMMU i GRUB: Legg til intel_iommu=on iommu=pt i /etc/default/grub og kjør update-grub.
  2. Last VFIO-moduler: Legg til vfio vfio_pci vfio_iommu_type1 i /etc/modules.
  3. Blokker vert-drivere: Hindre at Proxmox-verten bruker GPU-en ved å blackliste nouveau og nvidia.
  4. Sjekk IOMMU-grupper: Verifiser at GPU-en er i en egen gruppe. Hvis den deler gruppe med andre enheter, må du enten flytte kortet til en annen PCIe-slot eller bruke ACS override.
  5. Konfigurer VM: Bruk q35 maskintype, OVMF (UEFI), og legg til GPU-en som PCIe-enhet. Nvidia-kort har to funksjoner (video + lyd) – begge må tildeles.
  6. Installer drivere i VM: Standard Nvidia-drivere fungerer. Siden driver v465+ er Code 43-problemet på forbruker-kort løst.
GPU-passthrough bruksområder: VDI, AI, rendering og transkoding
Fire vanlige bruksområder for GPU-passthrough i SMB-servere.

Bruksområder

VDI (virtuelle skrivebord): Gi én eller flere brukere GPU-akselererte skrivebord for CAD, design eller videoredigering. Med passthrough får én bruker hele kortet. For flere brukere per GPU, vurder vGPU.

AI-inferens: Kjør modeller lokalt (LLM, bildegjenkjenning, talesyntese) på en GPU inne i en VM. Tesla T4 med 16 GB VRAM håndterer de fleste inferensoppgaver. For større modeller trengs 24+ GB VRAM.

3D-rendering: Arkitekturvisualisering, VFX eller produktdesign. Quadro- og RTX A-serien har ISV-sertifiserte drivere for profesjonell programvare (Autodesk, Adobe, DaVinci Resolve).

Videotranskoding: NVENC-motoren i Nvidia-kort håndterer HW-akselerert transkoding (H.264/H.265). Tesla T4 er spesielt populær for denne oppgaven fordi den har lavt strømforbruk og passiv kjøling.

Vanlige fallgruver

IOMMU-grupper: GPU-en kan dele IOMMU-gruppe med andre PCIe-enheter. Da må du tildele alle enheter i gruppen til samme VM – eller flytte GPU-en til en annen slot. Dell PowerEdge-servere har generelt bedre IOMMU-gruppeisolasjon enn forbruker-hovedkort, noe som gjør passthrough enklere. ACS override-patchen løser gruppeproblemer i programvare, men bryter maskinvareisolering og bør kun brukes i hjemmelab – aldri i produksjon.

AMD reset-bug: Noen AMD GPU-er (og eldre Nvidia Kepler/Maxwell) klarer ikke å resette seg etter at VM-en stoppes. Løsning: restart hele verten. Nyere kort (Pascal og nyere fra Nvidia) har ikke dette problemet.

Strømforsyning: GPU-er med høy TDP (200+ W) krever at serveren har nok strømkapasitet og 8-pins PCIe-strømkontakter. Dell PowerEdge-servere med GPU enablement kit har dette, men sjekk at PSU-ene er store nok – spesielt med flere GPU-er.

BIOS-lås: Noen servere krever at GPU-støtte aktiveres eksplisitt i BIOS (Dell kaller det «GPU Enablement»). Sjekk også at PCIe-sloten er satt til x16 og ikke delt.

Axentra:

Axentra leverer servere med GPU-kort ferdig installert og testet for passthrough. Dell R740 og R7920 støtter opptil tre dobbeltbredde-GPU-er. HPE ML350 G10 (tårnmodell) støtter opptil fire dobbeltbredde-GPU-er – mest av alle i denne klassen. Trenger du GPU separat? Se GPU-utvalget. Servere finnes i serverutvalget.

Ofte stilte spørsmål

Kan jeg bruke forbruker-GPU (GeForce) for passthrough?

Ja, fra Nvidia-driver v465+ fungerer GeForce-kort i VM uten Code 43-feil. Begrensningen er at GeForce-kort mangler ISV-sertifisering og ECC VRAM. For hjemmelab: helt greit. For produksjon: velg Quadro eller RTX A-serien.

Hvor mye VRAM trenger jeg for AI?

For inferens med mellomstore modeller (7B-parametere): 8–16 GB. For større modeller (13B+) eller trening: 24+ GB. Modellstørrelsen i VRAM avhenger av kvantisering – en 7B-modell i Q4 trenger ca. 4 GB, i FP16 ca. 14 GB.

Kan flere VM-er dele én GPU?

Ikke med passthrough – der får én VM hele kortet. For deling trenger du Nvidia vGPU (GRID), som krever lisens. Alternativt: bruk flere fysiske GPU-er og tildel én per VM.

Fungerer GPU-passthrough med Windows og Linux?

Ja, begge. Windows krever UEFI-boot (OVMF) for best resultat. Linux fungerer både med BIOS og UEFI. Nvidia-drivere er tilgjengelige for begge plattformer.

Hva er forskjellen på vDGA og vSGA i VMware?

vDGA gir én VM hele GPU-en (tilsvarer passthrough). vSGA deler GPU-en mellom flere VM-er via tidsslicing. vDGA gir best ytelse; vSGA gir bedre utnyttelse med mange brukere.

Kan jeg flytte en VM med GPU-passthrough mellom verter?

Ikke live (vMotion/migration). GPU-passthrough binder VM-en til en spesifikk fysisk enhet. For å flytte må du stoppe VM-en, frigjøre GPU-en, flytte VM-en og tildele en GPU på den nye verten.

Trenger jeg spesielle kabler for GPU i server?

De fleste server-GPU-er (Tesla T4, Quadro P4000) bruker kun PCIe-strøm fra sloten eller en 6/8-pins kontakt internt i serveren. Du trenger ikke ekstern skjermkabel med mindre du vil ha lokal skjermutgang fra VM-en.

Neste steg

Sjekk at serveren har IOMMU-støtte (VT-d) aktivert i BIOS, velg en GPU med riktig VRAM for oppgaven, og følg Proxmox-dokumentasjonen for VFIO-oppsett. For AI-inferens er Tesla T4 et rimelig og strømgjerrig førstevalg. For rendering og VDI gir Quadro P4000/P5000 god verdi på bruktmarkedet.