Перевёл Typeless: по модели нет пруфов, зато я раскопал цепочку поиска

На этот раз я на своём компьютере прошерстил Typeless как небольшой «проект маленького детектива». Цель была очень прямой: какую модель он вообще использует? Почему его взаимодействие «нажал — он слушает — сразу отвечает» настолько удобное, и почему при этом у него как назло нельзя нормально вести многоходовый диалог с уточняющими вопросами?

Сначала версия с выводами:

  • В локальном клиенте я не нашёл жёстко прописанного единственного имени модели. Я не увидел строк вроде gpt-4o, claude, gemini в лоб.
  • Это не локальная модель: ключевые запросы идут на https://api.typeless.com, главный AI-эндпоинт — /ai/voice_flow.
  • Его способность «поискать» — настоящая, и в локальной истории я вытащил запись с web_metadata, где напрямую появился grounding‑редирект vertexaisearch.cloud.google.com.
  • Но на публичных страницах Typeless также писали, что используют сторонних LLM‑провайдеров, например OpenAI. Так что больше похоже на «сервер выбирает возможности по сценарию», а не на то, что клиент намертво привязан к одной модели и всегда гонит её до конца.

Доказательства, которые я реально накопал, тоже довольно занятные:

  • Путь установки: C:\\Users\\1\\AppData\\Local\\Programs\\Typeless\\Typeless.exe
  • Пользовательские данные: C:\\Users\\1\\AppData\\Roaming\\Typeless.exe
  • Горячие клавиши — ровно мой обычный набор: RightAlt для записи, RightAlt+Space для режима без удерживания
  • Локальная база данных содержит только одну ключевую бизнес‑таблицу history
  • Я не увидел таблиц для многоходовых диалогов вроде conversation, thread, message
  • В записи voice_command в основном хранятся user_prompt, refined_text, web_metadata, external_action, delivery

Это заодно неплохо объясняет два пункта, из‑за которых я его одновременно люблю и ненавижу:

  1. Новое всплывающее окно чата почти не имеет контекста из прошлых раз.
    Причина очень простая: это скорее «одноразовая голосовая команда», а не непрерывный чат‑тред.

  2. После того как он ответил, нельзя по той же линии продолжить уточнять.
    Потому что на уровне локальной структуры он вообще не спроектирован как многоходовый диалог: это скорее «ты сказал одну фразу — я выдал один результат — транзакция завершена».

Есть ещё один ключевой железобетонный пруф:

Когда я спрашивал про актуальные вещи вроде «雷神加速器被恶意攻击,攻击者目的是什么?搜一下» (“Ускоритель Leishen подвергся злонамеренной атаке, какова цель атакующего? Поискать”), в локально сохранённом mode_meta.ai_result.web_metadata появилось:

  • grounding_chunks
  • grounding_supports
  • vertexaisearch.cloud.google.com/grounding-api-redirect/...

И в источниках видны сайты sina.com.cn, cnyes.com, youtube.com.

Это показывает, что как минимум для части «вопросов про свежую информацию» он действительно использует grounding‑процесс с поисковыми источниками, а не просто чинно‑благородно выдумывает на месте.

Поэтому самый надёжный вывод на этот раз такой:

Typeless больше похож на «голосовую глобальную AI‑панель команд».
Он силён в: быстроте, удобстве, возможности вызвать его где угодно, и в том, чтобы с учётом контекста текущего экрана сразу выдать результат.
Он слаб в: сохранении длинного контекста и многократных уточняющих вопросах вокруг одного ответа.

То есть это не «голосовой чат‑рум ChatGPT», а «голосовой глобальный слой AI‑быстрых действий».
И это как раз причина, почему он так хорошо ощущается в руке — и почему хочется ворчать «почему нельзя продолжить разговор».

Если нравится такой тип взаимодействия, я заодно прикинул близкие продукты:

  • Wispr Flow: больше всего похож на Typeless, в сторону «глобальная горячая клавиша + ввод в любое приложение»
  • Superwhisper: отлично для «выделил текст — одной фразой переписать/спросить»
  • Aqua Voice: сильнее заточен под контекст
  • Braina: больше похож на старый добрый Windows‑голосовой помощник плюс AI‑помощник для письма

Финал одной фразой:

Typeless не то чтобы «не умеет чатиться» — он изначально не проектировался как «чат‑инструмент»; он скорее голосовой AI‑работяга: позвал — сказал — он сделал.

Если дальше буду копать, больше всего хочу смотреть на две вещи:

  • можно ли по debug‑полям в ответах сервера вытащить более конкретные следы провайдера
  • какие вопросы у него идут через поиск, а какие — через обычную генерацию
1 лайк