El diseño de retry backoff de Codex es ridículo: tras un 403, cuanto más reintentas más pareces un bot

coco · 30 Marzo, 2026 16:18

Hace poco, al usar Codex CLI con un upstream no muy estable, me topé con un problema bastante gracioso, pero muy real.

Ahora Codex ha hecho que la reconexión en streaming sea un backoff exponencial hardcodeado. Las primeras veces parece normal, pero luego se dispara de forma muy exagerada:

La 1.ª vez, unos 0,2 segundos
La 5.ª vez, unos 3,2 segundos
La 10.ª vez ya pasa de 1 minuto
Más adelante incluso puede subir a una vez cada diez y tantos minutos, o incluso cada varias decenas de minutos

El problema es que este diseño asume por defecto que «cuanto más tiempo se falla, más lento debería ser el reintento». Pero en la práctica, muchos upstream no funcionan así:

El gateway falla de forma esporádica
El enrutamiento del backend es inestable
Algunos proxies compatibles con OpenAI devuelven temporalmente 403 / el estado de la cuota aún no se ha actualizado
En realidad, con intentarlo unas cuantas veces más, se recupera enseguida

Es decir, lo que realmente se necesita es:

Que el usuario decida por sí mismo la frecuencia de reintento
Al menos permitir reintentos con intervalo fijo, por ejemplo, una vez cada 500 ms
En lugar de quedar secuestrado por un backoff exponencial hardcodeado

Y aún más absurdo: Codex ahora le da al usuario stream_max_retries, pero no le da la posibilidad de configurar el intervalo de reintento ni la estrategia de backoff. Esto hace que:
puedes subir el número a 100, pero después del 10.º intento, cada espera empieza a volverse irrazonablemente larga, alejándose por completo del escenario de «con intentarlo unas cuantas veces más basta para que funcione».

Ya he llevado este problema al upstream:

github.com/openai/codex

Make stream reconnect delay/backoff configurable in config.toml

已打开 09:12AM - 29 Mar 26 UTC

constansino

enhancement CLI custom-model

Hard-coded exponential backoff for retryable stream reconnects makes some provid…er setups unusable. Today Codex exposes `stream_max_retries`, but not the reconnect delay strategy. The outer reconnect loop uses a fixed exponential backoff starting around 200ms and doubling on each retry, so by the time a session reaches the low teens it is already waiting many minutes between attempts. That is a poor fit for providers / gateways that frequently fail with retryable transient errors but often recover after a few quick retries. One concrete case is OpenAI-compatible upstreams that may briefly return `403 Forbidden` with an "insufficient balance / quota" message and then succeed again shortly afterward once the upstream gateway refreshes state or routes to a healthy backend. In that setup, users can already raise `stream_max_retries`, but they cannot express the retry cadence they actually need. By retry 10+ the built-in exponential backoff dominates and the CLI can end up waiting far longer than the upstream outage itself. Proposed behavior: 1. Keep the current default behavior for existing users. 2. Add provider-scoped TOML settings so users can choose the reconnect delay behavior explicitly. 3. Support at least: - a configurable base delay in milliseconds - a configurable backoff mode (`exponential` or `fixed`) Example desired config: ```toml [model_providers.custom] stream_max_retries = 100 stream_retry_delay_ms = 500 stream_retry_backoff = "fixed" ``` That would allow the common "retry every 500ms" workflow without requiring a local patch. I have a PR ready that implements exactly this shape while preserving the current default behavior.

Tengo la sensación de que este problema, en el fondo, no es solo que los parámetros estén mal elegidos, sino que el diseño se toma demasiadas atribuciones y no le deja al usuario libertad de elección.

Si en TOML se pudiera soportar explícitamente una configuración como la siguiente, al menos sería devolverle al usuario el poder de decisión:

[model_providers.custom]
stream_max_retries = 100
stream_retry_delay_ms = 500
stream_retry_backoff = "fixed"

Este tipo de necesidad es en realidad muy común:
«Este upstream suele fallar, pero si lo intentas rápido unas cuantas veces seguidas normalmente se recupera; por favor, no me lo alargues automáticamente a una vez cada varias decenas de minutos.»

Tema		Respuestas	Vistas
大家的工具建议版本用最新的! 同一句提示词，不同 Agent，智商差距现场对比，Codex 能把活干成“悬疑片”(贬义) :后续发现是版本问题通用 cli , 交互 , codex	1	12	3 Febrero 2026
2026年2月底的ai coding观点:你应该知道的一切长期追踪 cli , 交互 , 原理限制 , coding	1	19	27 Febrero 2026
为什么cli工具们不直接用webui? AIMB ui , cli , 交互 , 没想明白	2	19	6 Marzo 2026
Opus 4.6 与 Codex 5.3：深度技术对比与适用场景分析长期追踪对比	2	56	27 Febrero 2026
CLIProxyAPI 这次 auth 自动刷新与 watcher 优化修复的完整复盘通用优化 , 编程 , 性能 , unhandled	2	8	27 Abril 2026

El diseño de retry backoff de Codex es ridículo: tras un 403, cuanto más reintentas más pareces un bot

Temas relacionados