На этот раз я на своём компьютере прошерстил Typeless как небольшой «проект маленького детектива». Цель была очень прямой: какую модель он вообще использует? Почему его взаимодействие «нажал — он слушает — сразу отвечает» настолько удобное, и почему при этом у него как назло нельзя нормально вести многоходовый диалог с уточняющими вопросами?
Сначала версия с выводами:
- В локальном клиенте я не нашёл жёстко прописанного единственного имени модели. Я не увидел строк вроде
gpt-4o,claude,geminiв лоб. - Это не локальная модель: ключевые запросы идут на
https://api.typeless.com, главный AI-эндпоинт —/ai/voice_flow. - Его способность «поискать» — настоящая, и в локальной истории я вытащил запись с
web_metadata, где напрямую появился grounding‑редиректvertexaisearch.cloud.google.com. - Но на публичных страницах Typeless также писали, что используют сторонних LLM‑провайдеров, например OpenAI. Так что больше похоже на «сервер выбирает возможности по сценарию», а не на то, что клиент намертво привязан к одной модели и всегда гонит её до конца.
Доказательства, которые я реально накопал, тоже довольно занятные:
- Путь установки:
C:\\Users\\1\\AppData\\Local\\Programs\\Typeless\\Typeless.exe - Пользовательские данные:
C:\\Users\\1\\AppData\\Roaming\\Typeless.exe - Горячие клавиши — ровно мой обычный набор:
RightAltдля записи,RightAlt+Spaceдля режима без удерживания - Локальная база данных содержит только одну ключевую бизнес‑таблицу
history - Я не увидел таблиц для многоходовых диалогов вроде
conversation,thread,message - В записи
voice_commandв основном хранятсяuser_prompt,refined_text,web_metadata,external_action,delivery
Это заодно неплохо объясняет два пункта, из‑за которых я его одновременно люблю и ненавижу:
-
Новое всплывающее окно чата почти не имеет контекста из прошлых раз.
Причина очень простая: это скорее «одноразовая голосовая команда», а не непрерывный чат‑тред. -
После того как он ответил, нельзя по той же линии продолжить уточнять.
Потому что на уровне локальной структуры он вообще не спроектирован как многоходовый диалог: это скорее «ты сказал одну фразу — я выдал один результат — транзакция завершена».
Есть ещё один ключевой железобетонный пруф:
Когда я спрашивал про актуальные вещи вроде «雷神加速器被恶意攻击,攻击者目的是什么?搜一下» (“Ускоритель Leishen подвергся злонамеренной атаке, какова цель атакующего? Поискать”), в локально сохранённом mode_meta.ai_result.web_metadata появилось:
grounding_chunksgrounding_supportsvertexaisearch.cloud.google.com/grounding-api-redirect/...
И в источниках видны сайты sina.com.cn, cnyes.com, youtube.com.
Это показывает, что как минимум для части «вопросов про свежую информацию» он действительно использует grounding‑процесс с поисковыми источниками, а не просто чинно‑благородно выдумывает на месте.
Поэтому самый надёжный вывод на этот раз такой:
Typeless больше похож на «голосовую глобальную AI‑панель команд».
Он силён в: быстроте, удобстве, возможности вызвать его где угодно, и в том, чтобы с учётом контекста текущего экрана сразу выдать результат.
Он слаб в: сохранении длинного контекста и многократных уточняющих вопросах вокруг одного ответа.
То есть это не «голосовой чат‑рум ChatGPT», а «голосовой глобальный слой AI‑быстрых действий».
И это как раз причина, почему он так хорошо ощущается в руке — и почему хочется ворчать «почему нельзя продолжить разговор».
Если нравится такой тип взаимодействия, я заодно прикинул близкие продукты:
- Wispr Flow: больше всего похож на Typeless, в сторону «глобальная горячая клавиша + ввод в любое приложение»
- Superwhisper: отлично для «выделил текст — одной фразой переписать/спросить»
- Aqua Voice: сильнее заточен под контекст
- Braina: больше похож на старый добрый Windows‑голосовой помощник плюс AI‑помощник для письма
Финал одной фразой:
Typeless не то чтобы «не умеет чатиться» — он изначально не проектировался как «чат‑инструмент»; он скорее голосовой AI‑работяга: позвал — сказал — он сделал.
Если дальше буду копать, больше всего хочу смотреть на две вещи:
- можно ли по debug‑полям в ответах сервера вытащить более конкретные следы провайдера
- какие вопросы у него идут через поиск, а какие — через обычную генерацию