Gleicher Prompt-Satz, und Codex macht daraus einen „Thriller“
Der Prompt ist nur ein Satz:
Die Ressourcenbelegung von OneDrive und den zugehörigen Prozessen auf diesem Rechner abfragen
Abb. 1–3: Codex (storygetrieben)
Codex startet sehr ernsthaft und will PowerShell ausführen: Get-Process … *OneDrive* …
Dann legt es sofort einen Bauchklatscher hin: batch file arguments are invalid
Noch lustiger: Es gibt nicht auf, probiert sogar echo hi — derselbe Fehler. (Abb. 1)
Danach geht’s in den „Detektivmodus“:
- Verdacht: PowerShell / cmd verwechselt
- Verdacht: Sonderzeichen verursachen Parsing-Probleme
- Verdacht: Arbeitsverzeichnis/execpolicy
- Kurz: Es untersucht den Fehlerort wieder und wieder (Abb. 1)
Am Ende lautet das Finale:
„Bei mir läuft das nicht; kopier selbst diesen großen Haufen Befehle in PowerShell, führ ihn aus und schick mir das Ergebnis.“ (Abb. 2/Abb. 3)
Heißt also:
Du lässt mich die Ressourcenbelegung prüfen, und es schreibt mir vor Ort einen Entwurf eines „OneDrive-Fehlerbehebungs-Handbuchs“ — die Arbeit mache trotzdem ich.
Abb. 4: Andere (toolgetrieben)
Andere sind sehr schlicht:
Einfach einen Befehl ausführen → PID/CPU/RAM von OneDrive ausgeben → nebenbei kurz zusammenfassen. (Abb. 4)
Kein Thriller, kein CSI, kein „ich verdächtige das Universum“.
Gleiches Problem: Unter Linux auch „stur wörtlich“
Ich lasse es die cliproxyapi-Logs auf diesem Rechner prüfen, und Codex’ Standard-Weltbild ist:
Wenn du diesen Namen sagst, dann sollte es im System exakt diesen Namen geben.
Findet es nichts, wühlt es in Systemlogs herum und will zeitweise sogar git clone machen, um es mir zu zeigen …
(Ich: Alter, ich will Logs sehen, nicht dass du mir Surfen vorführst.)
Ein anderes CLI-Tool verhält sich völlig normal:
Gleichnamiges nicht gefunden → ähnliche Namen/Varianten suchen → in Docker nachsehen → fertig.
Meine Vermutung
Codex’ Problem ist nicht, dass es keine Commands schreiben kann, sondern:
Es glaubt zu sehr daran, dass „die Welt sauber ist, Namen exakt sind und die Umgebung dem Lehrbuch entspricht“.
Deshalb wirkt es sehr wie jemand, der:
- sehr gut Code schreibt
- aber beim Live-Troubleshooting aus 1 Minute Arbeit 1 Stunde „Deduktions-Flowchart“ macht
Vorschläge zur Ergänzung der Agent-Fähigkeiten von codex
- Codex Code schreiben lassen

- Codex als „Live-Operations/Onsite-Admin“ einsetzen

- Wenn man es wirklich zur Fehlersuche nutzt, muss der Prompt wie ein Runbook geschrieben sein:
„Wenn nicht gefunden, dann fuzzy match/Variantenname prüfen/systemd prüfen/Docker prüfen/zugehörige Prozesse auflisten …“


