Conseil : utilisez la dernière version de vos outils ! Même prompt, Agents différents, écart de QI en live ; Codex transforme le boulot en « film à suspense » (péjoratif) : au final, c’était un problème de version



Avec une seule et même invite, Codex peut transformer le boulot en “film à suspense”

L’invite tient en une phrase :

Rechercher l’utilisation des ressources de OneDrive local et des processus associés

Figures 1 à 3 : Codex (orienté scénario)

Codex commence très sérieusement, prêt à lancer du PowerShell : Get-Process … *OneDrive* …

Puis il se plante immédiatement : batch file arguments are invalid
Plus drôle encore, il n’en démord pas et essaie même echo hitoujours la même erreur. (Fig. 1)

Ensuite il passe en “mode détective” :

  • Il soupçonne une confusion entre PowerShell et cmd
  • Il soupçonne des caractères spéciaux qui causent un problème d’analyse
  • Il soupçonne le répertoire de travail / execpolicy
  • Bref, il commence à examiner la scène de l’erreur en boucle (Fig. 1)

Au final, la conclusion, c’est :
« De mon côté je ne peux pas l’exécuter, copie-colle toi-même ce gros pâté de commandes dans PowerShell, exécute-le, puis colle-moi le résultat. » (Fig. 2 / Fig. 3)

Autrement dit :

Je lui demande de vérifier l’utilisation des ressources, il m’écrit sur place un brouillon de “manuel de dépannage OneDrive”, et c’est toujours moi qui fais le boulot.

Figure 4 : Les autres (orienté outil)

Les autres font ça très simplement :
Exécuter directement une commande → sortir le PID/CPU/mémoire de OneDrive → et résumer au passage. (Fig. 4)

Pas de film à suspense, pas de CSI, pas de “je soupçonne l’univers”.


Même travers : sous Linux aussi, il “s’acharne sur le littéral”

Je lui demande de vérifier les logs locaux de cliproxyapi, et la vision du monde par défaut de Codex, c’est :

Si tu dis ce nom, alors il devrait exister exactement sous ce nom dans le système.

S’il ne le trouve pas, il commence à fouiller n’importe quels journaux système, et à un moment il veut même git clone pour me montrer…
(Moi : mec, je veux voir les logs, pas te voir faire du surf.)

Avec d’autres outils CLI, c’est tout à fait normal :
Introuvable sous le même nom → chercher des noms proches / variantes → aller voir dans Docker → terminé.


Mon hypothèse

Le problème de Codex, ce n’est pas qu’il ne sait pas écrire des commandes, mais plutôt :

Il croit trop que “le monde est propre, les noms sont exacts, l’environnement est celui d’un manuel”.

Du coup il ressemble beaucoup à ce genre de profil :

  • Très fort pour écrire du code
  • Mais en dépannage sur le terrain, il transforme un truc d’1 minute en 1 heure de “flowchart de raisonnement”

Suggestions pour compléter les capacités d’agent de codex

  • Laisser Codex écrire du code :white_check_mark:
  • Laisser Codex faire “l’ops sur le terrain” :cross_mark:
  • Si on veut vraiment l’utiliser pour dépanner, il faut écrire l’invite comme un runbook :
    « Si introuvable, faire une correspondance floue / chercher des noms variantes / vérifier systemd / vérifier Docker / lister les processus associés… »

Derrière, en résolvant l’affaire, on a découvert que c’était un problème de version de Codex : il se peut que l’ancien 0.88 et le nouveau 0.94 n’aient pas du tout la même toolchain (chaîne d’outils).\nAprès la mise à niveau, c’est résolu.\nLeçon de ce post : essayez d’utiliser la version la plus récente, car la toolchain (chaîne d’outils) par défaut peut être différente.\n