Empfehlung: nutzt bei allen Tools die neueste Version! Gleicher Prompt, unterschiedliche Agents – Live-Vergleich der IQ‑Unterschiede; Codex macht aus der Arbeit einen „Thriller“ (negativ): später stellte sich heraus, dass es ein Versionsproblem war

AIYA.DE5.NET · 3. Februar 2026 um 07:57

Gleicher Prompt-Satz, und Codex macht daraus einen „Thriller“

Der Prompt ist nur ein Satz:

Die Ressourcenbelegung von OneDrive und den zugehörigen Prozessen auf diesem Rechner abfragen

Abb. 1–3: Codex (storygetrieben)

Codex startet sehr ernsthaft und will PowerShell ausführen: Get-Process … *OneDrive* …

Dann legt es sofort einen Bauchklatscher hin: batch file arguments are invalid
Noch lustiger: Es gibt nicht auf, probiert sogar echo hi — derselbe Fehler. (Abb. 1)

Danach geht’s in den „Detektivmodus“:

Verdacht: PowerShell / cmd verwechselt
Verdacht: Sonderzeichen verursachen Parsing-Probleme
Verdacht: Arbeitsverzeichnis/execpolicy
Kurz: Es untersucht den Fehlerort wieder und wieder (Abb. 1)

Am Ende lautet das Finale:
„Bei mir läuft das nicht; kopier selbst diesen großen Haufen Befehle in PowerShell, führ ihn aus und schick mir das Ergebnis.“ (Abb. 2/Abb. 3)

Heißt also:

Du lässt mich die Ressourcenbelegung prüfen, und es schreibt mir vor Ort einen Entwurf eines „OneDrive-Fehlerbehebungs-Handbuchs“ — die Arbeit mache trotzdem ich.

Abb. 4: Andere (toolgetrieben)

Andere sind sehr schlicht:
Einfach einen Befehl ausführen → PID/CPU/RAM von OneDrive ausgeben → nebenbei kurz zusammenfassen. (Abb. 4)

Kein Thriller, kein CSI, kein „ich verdächtige das Universum“.

Gleiches Problem: Unter Linux auch „stur wörtlich“

Ich lasse es die cliproxyapi-Logs auf diesem Rechner prüfen, und Codex’ Standard-Weltbild ist:

Wenn du diesen Namen sagst, dann sollte es im System exakt diesen Namen geben.

Findet es nichts, wühlt es in Systemlogs herum und will zeitweise sogar git clone machen, um es mir zu zeigen …
(Ich: Alter, ich will Logs sehen, nicht dass du mir Surfen vorführst.)

Ein anderes CLI-Tool verhält sich völlig normal:
Gleichnamiges nicht gefunden → ähnliche Namen/Varianten suchen → in Docker nachsehen → fertig.

Meine Vermutung

Codex’ Problem ist nicht, dass es keine Commands schreiben kann, sondern:

Es glaubt zu sehr daran, dass „die Welt sauber ist, Namen exakt sind und die Umgebung dem Lehrbuch entspricht“.

Deshalb wirkt es sehr wie jemand, der:

sehr gut Code schreibt
aber beim Live-Troubleshooting aus 1 Minute Arbeit 1 Stunde „Deduktions-Flowchart“ macht

Vorschläge zur Ergänzung der Agent-Fähigkeiten von codex

Codex Code schreiben lassen
Codex als „Live-Operations/Onsite-Admin“ einsetzen
Wenn man es wirklich zur Fehlersuche nutzt, muss der Prompt wie ein Runbook geschrieben sein:
„Wenn nicht gefunden, dann fuzzy match/Variantenname prüfen/systemd prüfen/Docker prüfen/zugehörige Prozesse auflisten …“

AIYA.DE5.NET · 3. Februar 2026 um 08:39

Später wurde bei der Fehleranalyse festgestellt, dass es ein Problem mit der Codex-Version war. Offenbar unterscheiden sich die Toolchains der alten Version 0.88 und der neuen Version 0.94 möglicherweise.

Nach dem Upgrade war es behoben.

Lehre aus diesem Beitrag: Möglichst die neueste Version verwenden — möglicherweise ist sogar die Standard-Toolchain unterschiedlich.

Thema		Antworten	Aufrufe
[完整复盘] 一次被 pwsh.cmd 阴掉的 Codex Desktop 故障排查：从 WSL 误导到 Windows Native 真根因(batch file arguments are invalid) debug cli , windows , openai , 原理限制 , 冲突 , debug	1	29	10. März 2026
2026年2月底的ai coding观点:你应该知道的一切 AIVW cli , 交互 , 原理限制 , coding	1	19	27. Februar 2026
Opus 4.6 与 Codex 5.3：深度技术对比与适用场景分析 AIVW 对比	2	57	27. Februar 2026
Agent 编程的 TUI 只是过渡阶段暂时离开 IDE，也是为了更好地使用 Agent AIVW 交互 , ui	2	77	9. März 2026
Codex 这个重试退避设计也太离谱了：403 后越重试越像挂机 debug 优化 , 交互 , cli , openai , 原理限制 , unhandled , debug	0	6	30. März 2026