Performance-Troubleshooting unter Linux wird dann schwierig, wenn zu viele Einzelwerte gleichzeitig auf dich einprasseln. Genau deshalb brauchst du keine lose Sammlung aus top, htop, iostat und ss, sondern eine feste Reihenfolge: Was ist das Symptom, wo ist der Engpass und welche Messung bestätigt das?

Voraussetzungen

Linux-System mit Shell-Zugang
Sudo-Rechte für einige Diagnosebefehle
Idealerweise Grundpakete wie htop und sysstat

Schritt 1: Problem sauber eingrenzen

„Der Server ist langsam“ ist noch keine Diagnose. Wichtig ist zuerst: Seit wann? Betrifft es alle Nutzer oder nur einen Dienst? Tritt es dauerhaft oder nur zu Spitzenzeiten auf?

Verifizieren: Der Schritt ist erfolgreich, wenn du das Problem zeitlich und fachlich eingrenzen kannst.

Schritt 2: CPU und Load prüfen

uptime
htop
top

Load bedeutet nicht automatisch CPU-Problem. Hohe Load kann auch durch wartende Prozesse entstehen.

Verifizieren: Du bist hier fertig, wenn du sagen kannst, ob wirklich CPU-Knappheit vorliegt oder nur eine hohe Lastanzeige ohne volle CPU-Auslastung.

Schritt 3: RAM und Swap prüfen

free -h
vmstat 1 5

Wichtig ist nicht nur, wie viel RAM frei ist, sondern ob das System stark auf Swap ausweicht.

Verifizieren: Der Schritt ist erfolgreich, wenn du einschätzen kannst, ob Speicherdruck oder exzessiver Swap-Einsatz vorliegt.

Schritt 4: I/O und Festplattenlast prüfen

iostat -xz 1 3
lsblk

Hohe Wartezeiten auf Platten-I/O fühlen sich oft wie allgemeine Langsamkeit an, obwohl CPU und RAM unauffällig wirken.

Verifizieren: Du bist hier fertig, wenn du erkennen kannst, ob ein Storage-Engpass plausibel ist.

Schritt 5: Prozesse und Netzwerkverbindungen prüfen

ps aux --sort=-%cpu | head
ps aux --sort=-%mem | head
ss -tulpn
ss -s

Hier suchst du nach den Verursachern: Welcher Prozess frisst CPU oder RAM? Welche Dienste halten viele Verbindungen offen?

Verifizieren: Der Schritt ist erfolgreich, wenn du mindestens einen konkreten Kandidaten für das Verhalten benennen kannst oder bewusst sagen kannst, dass das Problem eher nicht im Prozess- oder Netzwerkbereich liegt.

Schritt 6: Messergebnisse zusammenführen

Die eigentliche Diagnose entsteht erst aus dem Zusammenspiel der Werte. Hohe Load plus unauffällige CPU, aber auffälliges I/O ist etwas völlig anderes als hohe CPU plus viele Webworker oder starker Swap-Druck.

Verifizieren: Der Schritt ist erfolgreich, wenn du das Problem in einer klaren Hypothese zusammenfassen kannst, zum Beispiel „nicht CPU, sondern I/O-bedingte Wartezeit“.

Troubleshooting

htop fehlt: Paket nachinstallieren oder vorerst mit top arbeiten.
iostat fehlt: Meist fehlt das Paket sysstat.
Werte springen stark: Dann mehrere Messungen über einen kurzen Zeitraum vergleichen statt nur einen Einzelwert zu betrachten.

Häufige Fragen

Ist hohe Load immer schlimm?

Nein. Entscheidend ist, ob Prozesse dabei sinnvoll arbeiten oder auf etwas warten.

Warum reichen einzelne top-Screenshots oft nicht?

Weil viele Engpässe zeitlich schwanken und erst über mehrere Messungen sichtbar werden.

Wann hilft ein Blick in die Logs?

Immer dann, wenn Last und Fehlerbilder zusammen auftreten. Dazu passt unser Grundlagenartikel zu journalctl und /var/log.

Fazit

Gutes Linux-Performance-Troubleshooting ist vor allem eine saubere Reihenfolge aus Fragen und Messungen. Wenn du CPU, RAM, I/O, Prozesse und Netzwerk getrennt prüfst und dann erst zusammendenkst, kommst du deutlich schneller zu einer belastbaren Ursache.

Weiterführende Anleitungen und Quellen

Quellen: man top, man htop, man iostat, man ss, Linux Performance Tools documentation.