AMD Instinct MI350P: PCIe-Karte mit 144 GB HBM3e

AMD Instinct MI350P: PCIe-AI-Beschleuniger für Enterprise-Server

AMD bringt mit der Instinct MI350P einen Dual-Slot-PCIe-Beschleuniger mit 144 GB HBM3e auf den Markt. Zielgruppe sind Unternehmen, die AI-Workloads ohne komplette MI300X-Plattform fahren wollen.

Marcel Schönfelder

IT-Freelancer & Inhaber

AMD hat mit der Instinct MI350P einen neuen AI-Beschleuniger für klassische Server-Plattformen vorgestellt. Anders als die OAM-basierten MI300X- und MI350X-Module steckt die MI350P in einem regulären Dual-Slot-PCIe-Gehäuse mit 144 GB HBM3e. Damit zielt AMD auf Unternehmen, die KI-Workloads in vorhandene Rack-Server integrieren wollen, ohne gleich auf eine komplette OAM-Plattform umzusteigen.

Worum es geht

Die MI350P ist die PCIe-Variante des CDNA-4-basierten MI350-Designs. Laut AMD vermarktet das Unternehmen die Karte gezielt für „AI-curious enterprises" – also Mittelständler und Großkunden, die KI-Inferenz oder kleinere Trainings-Jobs evaluieren wollen, ohne einen separaten DGX-/HGX-ähnlichen Cluster zu kaufen. Die Karte unterstützt FP4-Inferenz und nutzt 144 GB HBM3e als Speicher. Verkaufsstart und konkrete Listenpreise hat AMD noch nicht bekanntgegeben; ausgewählte OEMs sollen die Karte in ihre Server-Baureihen integrieren.

Strategisch positioniert sich AMD damit zwischen der eigenen MI300X/MI350X-Familie für reine AI-Cluster und Nvidias L40S/RTX-Pro-Karten, die ebenfalls als PCIe-Drop-in für gemischte Workloads angeboten werden. Im Datacenter-Roadmap hat AMD darüber hinaus die MI400-Serie für die zweite Jahreshälfte 2026 angekündigt.

Wie prüfe ich, ob meine Server tauglich sind?

Vor einem Probe-Einbau sollte man Slot-Bauform, Steckplatz-Versorgung und verfügbare PCIe-Lanes prüfen. Auf einem Ubuntu-Host hilft lspci in Kombination mit dmidecode:

sudo lspci -vv | grep -E 'LnkCap|LnkSta|Region 0' | head -20

Für die thermische Reserve und Netzteil-Auslegung den aktuellen Stromverbrauch auslesen:

sudo dmidecode -t 39 | grep -E 'Max Power|Type:|Status'

Wer schon AMD- oder Nvidia-Beschleuniger im Server hat, sieht den ROCm- bzw. CUDA-Stack-Stand mit:

rocminfo | head -20 || nvidia-smi --query-gpu=name,driver_version,pstate --format=csv

Was bei der Beschaffung zählt

Eine PCIe-Karte mit 144 GB Speicher braucht eine entsprechende Plattform: Dual-Slot-Bauform, mindestens PCIe 5.0 x16, hohe TDP-Toleranz und einen geeigneten Luftstrom. AMD nennt für die MI350P keine offizielle TDP-Zahl in der Zusammenfassung – wer die Karte evaluiert, sollte beim Hersteller des Servers das offizielle Datenblatt anfordern und die Kühlpfade vorab simulieren lassen. Software-seitig läuft die Karte auf ROCm; Migration bestehender CUDA-Workloads erfordert in der Regel HIP-Portierung oder den Einsatz von Tools wie HIPIFY.

Für den DACH-Mittelstand ist die MI350P vor allem dort interessant, wo bereits AMD-EPYC-basierte Server stehen und ein einheitlicher Lieferanten-Stack gewünscht ist. Wer bislang ausschließlich Nvidia eingesetzt hat, sollte vor einer Beschaffung einen klaren Proof-of-Concept einplanen – inklusive Latenz-, Energie- und Wartungsvergleich.

Mehr aus der Kategorie Hardware: News aus der Kategorie Hardware

Quelle: The Register – AMD puts out new slottable GPU for AI-curious enterprises.

Worum es geht

Wie prüfe ich, ob meine Server tauglich sind?

Was bei der Beschaffung zählt

Weiter lesen

GPU für lokale KI auswählen: VRAM-Bedarf, RTX-5000-Generationen und Budget-Empfehlungen 2026

Homebridge mit Docker installieren: Tausende nicht-HomeKit-fähige Geräte in Apple Home einbinden

Festplatten-Ausfall vorhersagen: SMART-Monitoring mit smartd und Scrutiny