今回はローカル機上の Typeless を、小さな探偵プロジェクトみたいに一通りひっくり返して調べてみた。狙いはシンプルで、こいつはいったいどのモデルを使っているのか? それと、あの「押したら話を聞いて、そのまま返してくる」体験がなんであんなに気持ちよく回るのに、どうして多輪の追い質問ができないのか?
まず結論版:
- ローカルクライアント内には、特定の単一モデル名がベタ書きされている形では見つからなかった。
gpt-4o、claude、geminiみたいな直球文字列はヒットしなかった。 - ローカルモデルではなく、コアのリクエストは
https://api.typeless.comを通っていて、主な AI 入口は/ai/voice_flow。 - 「検索する」能力は本物で、ローカル履歴の中で
web_metadata付きの記録を1本つかめた。その中にvertexaisearch.cloud.google.comの grounding リダイレクトリンクがそのまま出ていた。 - ただし Typeless の公式公開ページには、OpenAI などの第三者 LLM provider(LLMプロバイダー)を使う旨も書かれていたことがある。なので「クライアントが1つのモデルに縛られて最後まで突っ走る」より、「サーバー側が用途に応じて能力を切り替える」寄りに見える。
実際に掘れた証拠がなかなか面白い:
- インストール先は
C:\\Users\\1\\AppData\\Local\\Programs\\Typeless\\Typeless.exe - ユーザーデータは
C:\\Users\\1\\AppData\\Roaming\\Typeless.exe - ホットキー設定はまさに普段使ってるやつ:
RightAltで録音、RightAlt+Spaceで押しっぱなし不要モード - ローカルDBはコア業務テーブルが
history1枚だけ conversation、thread、messageみたいな多輪会話用テーブルは見当たらないvoice_commandレコードに主に入っているのはuser_prompt、refined_text、web_metadata、external_action、delivery
これで、俺が愛憎入り混じってる2点もついでに説明がつく:
-
新しく出てくるチャット窓に、基本的に前回の文脈がない。
理由は単純で、これは「一回きりの音声コマンド」に近く、継続するチャットスレッドじゃないから。 -
返答のあと、そのまま前の話を引き継いで追い質問できない。
ローカル構造からして多輪会話前提で設計されておらず、「一言言う→結果を返す→このトランザクション終了」みたいな作りだから。
あと、かなり重要な実弾(確証)が1つ:
「雷神加速器が悪意ある攻撃を受けた、攻撃者の目的は何?検索して」みたいなリアルタイム系の質問をしたとき、ローカルに保存された mode_meta.ai_result.web_metadata の中に以下が出てきた:
grounding_chunksgrounding_supportsvertexaisearch.cloud.google.com/grounding-api-redirect/...
さらにソースとして sina.com.cn、cnyes.com、youtube.com といったサイトも見えている。
つまり少なくとも一部の「最新情報が絡む質問」では、検索ソース付きの grounding フローを確実に通していて、ただ真顔でその場のデタラメを捏造してるだけではない、ということ。
なので今回いちばん堅い結論はこう:
Typeless は「音声版のグローバルAIコマンドパネル」に近い。
得意なのは:速い、手に馴染む、どこからでも呼び出せる、今の画面コンテキストと組み合わせて即結果を出す。
苦手なのは:長いコンテキストの保持、同じ回答を軸に行ったり来たりの多輪追い質問。
要するに、「音声版 ChatGPT のチャットルーム」ではなく、「音声版の全局AIクイック操作レイヤー」。
これが手触りの良さの理由であり、「なんで続けて会話できないんだよ」とツッコミたくなる理由でもある。
この手の体験が好きなら、近いプロダクトもついでにざっと見てきた:
- Wispr Flow:いちばん Typeless に近い。いわゆる「全局ホットキー + 任意アプリへの入力」寄り
- Superwhisper:「テキスト選択→一言で書き換え/質問」用途にかなり合う
- Aqua Voice:コンテキスト認識の比重が高め
- Braina:Windows の古参音声アシスタント + AIライティングアシスタントに近い
一言で締めると:
Typeless は会話ができないわけじゃなく、そもそも自分を「チャットツール」として設計していない;むしろ、呼べばすぐ来て、言い終わったら仕事をする、音声AIの便利屋に近い。
この先さらに深掘りするなら、俺がいちばん見張りたいのはこの2つ:
- サーバー返却の debug フィールドから、より具体的な provider(プロバイダー)手がかりを引き続き抜けるか
- どの質問が検索を通り、どの質問が通常生成だけを通るのか