Stell dir vor, du wirst als Site Reliability Engineer (SRE) in der öffentlichen Verwaltung eingestellt, um ein System resilient und stabil zu machen. Du bringst Konzepte mit wie Error Budgets und Blameless Post-Mortems – mathematisch fundierte Feedbackschleifen. Doch in der Verwaltung prallst du gegen die Wand der „Lesbarkeit“. Die Forderung: „Übersetze SRE in ITIL-Begriffe, damit wir es verstehen.“

Das ist kein Übersetzungswunsch, das ist Informationsvernichtung. Wer SRE (eine Ingenieursdisziplin) in ITIL (ein Verwaltungsframework) presst, macht aus einem Chirurgen einen Sachbearbeiter.

ITIL, das Bürokratiemonster.

Wie Governance wirklich funktioniert

Schon James Watt wusste 1788, wie man Systeme stabilisiert. Sein Fliehkraftregler (Governor ) für die Dampfmaschine ist das Ur-Modell der Kybernetik: Steigt der Druck und damit die Drehgeschwindigkeit, fliegen die Gewichte nach außen und drosseln den Dampf. Automatisch, in Echtzeit und ohne Meeting.

Maturana würde sagen: Das System ist autopoietisch – es erhält sich selbst durch interne Rückkopplung. ITIL hingegen baut den Regler ab. Man ersetzt die mechanische Kopplung durch ein Gremium (CAB), das wöchentlich darüber abstimmt, ob man das Ventil jetzt ein Stück zudrehen sollte. ITIL ist der Versuch, eine Dampfmaschine durch das Vorlesen von Protokollen vor der Explosion zu bewahren. Das kann nicht funktionieren, weil die Latenz des Managements immer größer ist als die Dynamik des Systems.

Das Nyquist-Shannon-Problem

Man kann das Problem mathematisch präzisieren. Wenn wir die Dynamik des Systems (Releases, Skalierung, Fehlerreaktionen) als Signal betrachten, besagt das Abtasttheorem, dass man mindestens mit der doppelten Frequenz der höchsten vorkommenden Frequenz messen muss, um das Signal getreu abzubilden.

  • SRE: Arbeitet mit automatisierten Metriken im Sekundenbereich. Die Abtastrate ist hoch genug, um die Systemkurve flüssig zu steuern.
  • CAB: Selbst bei zwei Sitzungen pro Tag liegt die „Abtastrate“ bei $f_s \approx 2,3 \cdot 10^{-5} \text{ Hz}$. Jedes Systemereignis, das schneller abläuft als der Meeting-Zyklus, ist für das CAB unsichtbar oder wird als verzerrtes Rauschen wahrgenommen. Die Latenz des Managements ist strukturell immer größer als die Dynamik des Systems. Ein CAB versucht im Grunde, ein HD-Video mit einem Standbild pro Woche zu verstehen.

Das historische Desaster: Forstwissenschaft in Preußen

Das kanonische Gegenbeispiel liefert James C. Scott in Seeing Like a State: Im späten 18. Jahrhundert wollten preußische Forstbeamte den Wald „lesbar“ machen. Ein natürlicher Wald war ihnen zu chaotisch: verschiedene Baumarten, Totholz, krumme Pfade – man konnte den Wert des Holzes nicht berechnen.

Die Lösung der Bürokraten

  1. Tabula Rasa: Der Mischwald wurde gerodet.
  2. Monokultur: Man pflanzte nur noch eine Sorte (meist Fichten), weil die schnell wuchsen.
  3. Geometrie: Die Bäume wurden in exakten Reihen gepflanzt.
  4. Säuberung: Unterholz und totes Holz wurden entfernt.

Vorher: Resilienter Mischwald. Nachher: Anfällige Fichtenmonokultur

Kurzfristig war das Management begeistert. Man konnte den Holzertrag auf Jahre im Voraus in Excel-Tabellen (oder was man damals halt hatte) berechnen. Aber nach zwei Generationen starben die Wälder massenhaft ab. Ohne Unterholz, ohne die Vielfalt der Arten und ohne das lokale Wissen des Försters fehlte dem System die Resilienz. Schädlinge und Wind hatten leichtes Spiel. Das System war fragil geworden.

Der Kampf um die „Lesbarkeit“

Wir erleben wir hier den Krieg zweier Wissensformen:

Das Management versucht, deine Mētis zu verschlingen (wie Zeus die Göttin Mētis), um sie in Techne zu verwandeln. Sie wollen deine Erfahrung in einen Prozess gießen, damit du ersetzbar wirst. Doch Mētis lässt sich nicht kodifizieren. Wenn der Experte geht, stirbt der Wald – übrig bleibt die Monokultur der Bürokratie.

SRE und Systemtheorie: Die Logik des Misslingens

Warum agiert das Management so irrational? Dietrich Dörner nennt es die Logik des Misslingens. In komplexen Systemen starren Amateure auf isolierte Variablen und lösen eine Notabschaltung aus, ohne die Fernwirkungen zu begreifen.

Nassim Taleb würde dieses Verhalten als fragil bezeichnen. ITIL versucht, Risiken durch Verbote zu eliminieren. SRE hingegen ist antifragil: Es nutzt Fehlerbudgets, um aus Störungen zu lernen.

Wer SRE-Begriffe verbietet, klebt am Armaturenbrett die Motorwarnleuchte zu.

Dann wurde Kubernetes eingeführt. Weil ein System, das schon mit einfachen Linux-Servern und Shell-Skripten überfordert war, durch die Einführung einer der komplexesten Abstraktionsschichten der IT-Geschichte (Kubernetes) und deren Enterprise-Verpackung (VMware Tanzu) schlagartig gesundet.

Das ist die „Silver Bullet“-Eskalationsstufe (vgl. Fred Brooks). Denn Tanzu ist der feuchte Traum des Managements für Legibility:

  1. Zentralisierung: Man hat ein Dashboard, auf dem man alles sieht. Dass man nichts davon versteht, ist egal – es sieht nach Kontrolle aus.
  2. Lizenz-Sicherheit: Man kann eine Support-Nummer anrufen. Das beruhigt das Management mehr als ein brillanter Engineer, der das Problem in fünf Minuten mit strace löst.
  3. BWL-Kompatibilität: Man spricht jetzt über „Namespaces“, „Pods“ und „Resources“ statt über physikalische Realitäten. Es ist eine weitere Abstraktionsebene, auf der man wunderbar Meetings abhalten kann.

Es ist ein Akt tiefer Respektlosigkeit gegenüber der Ingenieurskunst: Das Management glaubt fest daran, dass man Mētis (das Können der eigenen Leute) durch Support-Verträge ersetzen kann. Man kauft lieber die Illusion von Sicherheit bei VMWare, als den eigenen Engineers den Einfluss und die Einstellmöglichkeiten zu geben, die sie für ein stabiles System bräuchten. Diese Rechnung geht nicht auf: Der „Premium-Support“, für den man die Kompetenzen der eigenen Belegschaft geopfert hat, ist nach der Broadcom-Übernahme völlig unbrauchbar.

Ausblick

Wir müssen aufhören, so zu tun, als ob ITIL und SRE das Gleiche wären.

Wer Experten will, muss ihre Mētis respektieren. Wer nur Techne will, bekommt Berater-PowerPoints und Business-Prozesse, aber keine stabilen Systeme. Die aktuelle Stabilität vieler Behörden-IT ist kein Sieg der Bürokratie, sondern eine Form der Iatrogenese -Prävention. Die Praktiker vor Ort reparieren im Verborgenen, was die Theorie oben beschädigt. Sie nutzen ihre Mētis, um die strukturelle Blindheit der Techne zu heilen. Es ist ein Parasitismus: Die Verwaltung zehrt von der informellen Kompetenz derer, deren Sprache sie eigentlich verbieten will.

Die Ironie der Geschichte: In der modernen Forstwirtschaft hat man sich den Fehler längst eingestanden. Man ist weg von der Monokultur, zurück zur Naturverjüngung des Waldes. Man lässt den Wald wieder Wald sein, weil man begriffen hat, dass ein komplexes Ökosystem sich selbst am besten reguliert.

Doch während die Natur längst zur Vernunft zurückgekehrt ist, hat das preußische Beamtentum in unseren Teppichetagen den Wandel noch nicht vollzogen. Sie pflanzen weiterhin ihre digitalen Monokulturen in Reih und Glied und wundern sich, warum beim nächsten Sturm alles zusammenbricht.

Der Wald hat gelernt. Das Management hat nur neue Handbücher gekauft.

Kommentare

Suche starten

Geben Sie Schlüsselwörter ein, um Artikel zu suchen

↑↓
ESC
⌘K Tastenkürzel