openclaw20260213 уже набрал 188k звёзд, но всё ещё слишком сырой: слишком много проблем, даже с компрессией контекста не разобрались — запись о тяжёлой отладке

yezi · 12.Февраль.2026 16:48:40

openclaw20260213 уже набрал 188k звёзд, но всё ещё слишком новый: проблем слишком много, и даже сжатие контекста не доделано — тяжёлый разбор одной отладки

Автор：三局两胜
Время：2026-02-13

Это — полный отчёт об одной отладке, которую я за последние два дня «прогрыз» вместе с ботом. Сразу выводы:

«Пустой ответ» — это не значит, что модель недоступна, и это не точечная поломка QQ-плагина。
Корневая причина — неконтролируемое раздувание контекста диалога, из‑за чего срабатывает silent overflow（output=0）。
В текущей версии OpenClaw в этом сценарии действительно есть проблема «без подсказки, без авто-восстановления»（у официальных уже есть issue/PR）。

一、Симптомы сбоя（реальная ситуация, с которой я столкнулся）

У меня проявлялось так:

В QQ‑группе бот внезапно начал отвечать «пусто»（выглядит как будто не ответил, или записался только assistant turn, но контент пустой）。
В TG в тот же период всё выглядело нормально, из‑за чего возникала иллюзия «может, сломался QQ‑плагин».
В WebUI видно, что сессия продолжает писать логи, но со стороны пользователя нет валидного текста.

Поначалу отладка была очень хаотичной, потому что в тот же период ещё вперемешку были:

проблемы в цепочке отправки файлов（NapCat rich media）
триггеры в группе/логика упоминания @
конфигурации админов и чёрного списка

Эти проблемы мешают наблюдениям и делают корень «пустого ответа» неочевидным с первого взгляда.

二、Путь диагностики（в хронологическом порядке）

1) Сначала убедиться, что API не «легло» целиком

Я сначала проверил, что апстрим‑API（newapi/cpa）доступен в других клиентах。
Затем посмотрел локальные логи сессии OpenClaw и обнаружил: это не падение запроса, а типичные записи:
- usage.input очень большой（уровня 200k~300k）
- usage.output = 0
- content = []

Этот шаг критически важен: значит проблема не в том, что «не отправляется», а в том, что «со стороны модели вернулся пустой вывод».

2) Сравнить объём сессий QQ и TG

Я вытащил и посмотрел ключевые файлы сессий:

Сессия QQ‑группы：cb77ecdc-6d64-489f-8aa1-d63a92d67ce7.jsonl
Сессия TG‑лички：9c1c29b4-b309-4b71-a1bd-5a7fd8541679.jsonl

Результат очень наглядный:

История QQ‑сессии огромная, и много раз встречается input≈260k~282k。
В TG в тот же период примерно input≈36k~38k, ответы нормальные。

3) Точно найти, «в какой момент вдруг раздулось»

В QQ‑групповой сессии точка перегиба совпала с одной «задачей поиска»:

подряд записалось много сверхдлинных toolResult（SearchResults）
длина одной записи — десятки KB（например 48k / 38k / 24k）
после этого input‑tokens мгновенно прыгнули до 282k, и пошли подряд пустые ответы

То есть контекст «взорвала» не какая‑то обычная реплика пользователя, а то, что результаты инструмента целиком записались в сессию, и протолкнули и так уже большую сессию за критическую границу.

4) Проверить, «а в TG поиск попадает в контекст?»

Я специально сделал контрольное сравнение:

В TG тоже записывается toolResult（так же попадает в контекст）
Но базовый объём TG‑сессии меньше, поэтому она не взорвалась сразу

Этот шаг ломает распространённое заблуждение:

не так, что «в TG не попадает в контекст, а в QQ попадает»
а так, что «в обоих попадает — кто раньше достигнет лимита, тот раньше и сломается»

5) Провести жёсткий эксперимент（доказать, что это не иллюзия）

Я сделал два раунда экспериментов:

сначала поменял привязку сессии（TG указывал на QQ‑сессию）
затем сделал эксперимент с файловой подменой（скопировал содержимое огромной QQ‑сессии в файл TG‑сессии）

В итоге подтвердилось: как только заставить TG «съесть» ту сверхбольшую историю, там тоже появляются пустые ответы. Это ещё сильнее зафиксировало корень проблемы.

三、Итоговая корневая причина

Корень можно свести к трём фразам:

История сессии слишком большая（особенно из‑за большого количества toolResult/raw‑контента поиска）。
Когда запрос достигает/превышает эффективное окно контекста модели, возвращается stopReason=length + output=0。
В текущем OpenClaw стратегия восстановления на ветке «silent overflow» недостаточна, и со стороны пользователя это выглядит как «бот умер и отвечает пусто».

四、Почему по ощущениям это так плохо

Потому что есть три «контринтуитивные» особенности:

Это не ошибка：часто не выбрасывается явная ошибка, а выглядит как «успешно завершилось, но без контента».
Не воспроизводится сразу：обычно срабатывает внезапно после накопления длинной сессии。
Не привязано к одной платформе：и QQ, и TG могут попасть, просто зависит от того, где сессия раньше раздуется до лимита。

五、Мой временный план «остановки кровотечения»（практически применимо）

Если видите пустой ответ — сначала /newsession или переключение на новую сессию, не пытайтесь «пробить» уже раздутую сессию.
Сократить запись больших исходных текстов инструментов в историю, особенно результаты поиска и длинные веб‑страницы.
Сделать предупреждение «контекст слишком тяжёлый» на уровне плагина（например, при превышении порога input — предлагать открыть новую сессию）。
Для группового сценария рекомендую держать «тестовую маленькую группу（группа на двоих）」для наблюдения за эксплуатацией — так проще быстро проверять состояние бота.

六、Официальный статус：Issue/PR уже есть, но фиксы ещё в процессе

1) Официальные issue（похожие проблемы）

Issue #14064
Session exceeding context window produces silent empty replies — no compaction triggered
[Bug]: Session exceeding context window produces silent empty replies — no compaction triggered · Issue #14064 · openclaw/openclaw · GitHub
Issue #5771
Context overflow error
[Bug]: Context overflow error · Issue #5771 · openclaw/openclaw · GitHub

2) Соответствующий PR‑фикс（ключевая идея）

PR #14157
fix(agents): detect silent context overflow (stopReason=length, output=0)
fix(agents): detect silent context overflow (stopReason=length, output=0) by 0xRaini · Pull Request #14157 · openclaw/openclaw · GitHub

Ключевая идея этого PR:

распознавать ветку «silent overflow»
включать её в overflow recovery（триггерить compaction/retry），а не считать нормальным завершением

Я считаю, что идея правильная — по крайней мере, это гораздо надёжнее, чем «пользователь вручную удаляет файл сессии».

七、Дополнительные доработки, которые я сделал у себя（на стороне плагина）

Во время этой отладки я также внедрил пачку сопутствующих исправлений（чтобы не смешивать другие проблемы）：

Исправил изоляцию ключей сессии между QQ‑личкой/группой, чтобы не было «перепутывания» между каналами.
Привёл /newsession из «команды для вида» к «реальному очищению сессии».
Добавил подсказку‑заглушку на случай пустого ответа, чтобы пользователь не воспринимал это как полную потерю связи.
Исправил повторное наслоение суффикса занятости（чтобы не было ник(вводит)(вводит)）。

Но важно подчеркнуть: это улучшает UX, а настоящий «silent overflow из‑за сверхбольшого контекста» всё равно требует решения на уровне ядра。

八、Советы тем, кто столкнётся потом

Если у вас тоже «логи вроде бегут, но ответ пустой»:

Сначала проверьте usage.input/output у соответствующей session.
Если видите output=0 и огромный input — в первую очередь подозревайте переполнение контекста.
Сразу откройте новую сессию для проверки, не гоняйте попытки в старой.
Проверьте, не записываете ли вы большие toolResult（поиск/веб）в сессию без обрезки.
Следите за прогрессом мержа #14064 / #14157.

Это действительно была «очень тяжёлая, но очень стоящая» отладка.
OpenClaw очень мощный, но он всё ещё очень новый — «пользоваться и по ходу допиливать» здесь норма.
Надеюсь, эта запись поможет следующим людям меньше наступать на те же грабли.

— 三局两胜

Тема		Ответов	Просм.
OpenClaw + QQ 插件接入与超长排错复盘（全过程） debug 吹水 , openclaw , debug	0	52	11.02.2026
OpenClaw QQ /临时列表异常复盘：12条限制、重复回复与不回复问题 debug debug	0	20	19.02.2026
[优化复盘] OpenClaw 全渠道禁用 4 点自动换 Session debug openclaw , 交互 , debug	0	73	22.02.2026
一次“顺手升个 OpenClaw”为什么能做成 1 小时 22 分钟 debug unhandled , debug	2	9	01.05.2026
"OpenClaw 浏览器发帖链路故障复盘：从 fields are required 到 stale ref 的系统级修复" debug openclaw , 交互 , 原理限制 , debug	0	21	23.02.2026