באותו פרומפט בדיוק, Codex מסוגל להפוך את העבודה ל“מותחן בלשי”
הפרומפט הוא משפט אחד:
בדוק במחשב המקומי את צריכת המשאבי OneDrive והתהליכים הקשורים
תמונות 1–3: Codex (עלילתי)
Codex מתחיל מאוד ברצינות, ומתכונן להריץ PowerShell: Get-Process … *OneDrive* …
ואז מיד מתרסק: batch file arguments are invalid
מצחיק יותר: הוא לא מוותר, וניסה אפילו echo hi — עדיין אותה שגיאה. (תמונה 1)
אחר כך הוא נכנס ל“מצב בלש”:
- חושד שהתבלבל בין PowerShell ל-cmd
- חושד שתווים מיוחדים גרמו לבעיית פירוש
- חושד בספריית העבודה/execpolicy
- בקיצור, מתחיל לחקור שוב ושוב את זירת התקלה (תמונה 1)
בסוף זה נגמר ב:
“אצלי זה לא רץ, תעתיק בעצמך את כל גוש הפקודות הזה ל-PowerShell, תריץ, ואחרי זה תדביק לי את הפלט.” (תמונה 2/תמונה 3)
כלומר:
ביקשתי ממנו לבדוק צריכת משאבים, והוא במקום זה כתב לי במקום העבודה טיוטה של “מדריך פתרון תקלות OneDrive”, ואת העבודה עדיין אני עושה.
תמונה 4: אחרים (כלי-מוכוון)
אצל אחרים זה מאוד פשוט:
מריצים פקודה אחת → מקבלים PID/CPU/זיכרון של OneDrive → ועל הדרך מסכמים. (תמונה 4)
בלי מותחן, בלי CSI, בלי “אני חושד ביקום”.
אותה מחלה: גם בלינוקס הוא “נתקע על המילוליות”
ביקשתי ממנו לבדוק את הלוגים של cliproxyapi במחשב המקומי, ותפיסת העולם הדיפולטית של Codex היא:
אם אמרת את השם הזה, אז במערכת צריך להתקיים בדיוק השם הזה.
אם הוא לא מוצא, הוא מתחיל לנבור בלוגים של המערכת, ובשלב מסוים אפילו רצה לעשות לי git clone כדי להראות…
(אני: אחי, אני רוצה לראות לוגים, לא לראות אותך גולש.)
עם כלים אחרים בשורת פקודה (CLI) זה לגמרי רגיל:
לא מוצאים שם זהה → מחפשים שם דומה/וריאציות → בודקים בתוך Docker → נגמר.
ההשערה שלי
הבעיה של Codex היא לא שהוא לא יודע לכתוב פקודות, אלא ש:
הוא יותר מדי מאמין ש“העולם נקי, השמות מדויקים, והסביבה היא לפי ספר הלימוד”.
אז הוא מאוד מזכיר טיפוס כזה:
- חזק מאוד בכתיבת קוד
- אבל בדיבוג/תפעול בשטח יהפוך עבודה של דקה ל“תרשים זרימה בלשי” של שעה
הצעות להשלמת יכולות ה-agent של Codex
- לתת ל-Codex לכתוב קוד

- לתת ל-Codex להיות “אופרציה בשטח”

- אם ממש רוצים להשתמש בו לאבחון תקלות, הפרומפט צריך להיות כתוב כמו ספר נהלים (runbook):
“אם לא נמצא אז התאמה מטושטשת/חיפוש שמות וריאנטים/בדיקת systemd/בדיקת Docker/רשימת תהליכים קשורים……”


