Dieses Mal habe ich das Typeless auf meinem Rechner wie ein kleines Detektivprojekt einmal komplett „auseinandergenommen“. Das Ziel war ganz direkt: Welches Modell nutzt es eigentlich? Warum fühlt sich diese Interaktion „einmal drücken, es hört dir zu und antwortet sofort“ so geschmeidig an – und warum kann man ausgerechnet nicht mehrstufig nachhaken?
Zuerst die Kurzfassung der Ergebnisse:
- Im lokalen Client habe ich keinen fest verdrahteten, einzelnen Modellnamen gefunden. Ich habe keine eindeutigen Strings wie
gpt-4o,claude,geminio. Ä. entdeckt. - Es ist kein lokales Modell. Die Kern-Requests laufen über
https://api.typeless.com, der wichtigste AI-Endpunkt ist/ai/voice_flow. - Die „mal eben suchen“-Fähigkeit ist echt: In meinem lokalen Verlauf habe ich einen Eintrag mit
web_metadatagefunden, in dem direkt ein Grounding-Redirect-Link vonvertexaisearch.cloud.google.comauftaucht. - Auf Typeless’ offiziellen öffentlichen Seiten steht aber auch, dass Drittanbieter-LLM-Provider genutzt werden, z. B. OpenAI. Es wirkt also eher so, als würde der Server je nach Szenario Fähigkeiten umschalten – statt dass der Client stur an ein einziges Modell gebunden ist und damit alles „durchzieht“.
Die Belege, die ich tatsächlich ausgegraben habe, sind ziemlich interessant:
- Installationspfad:
C:\\Users\\1\\AppData\\Local\\Programs\\Typeless\\Typeless.exe - Benutzerdaten:
C:\\Users\\1\\AppData\\Roaming\\Typeless.exe - Hotkey-Konfiguration ist exakt meine übliche:
RightAltzum Aufnehmen,RightAlt+Spacefür den Modus ohne Gedrückthalten - Die lokale Datenbank hat nur eine zentrale Business-Tabelle:
history - Keine Tabellen wie
conversation,thread,message, die für Mehr-Runden-Dialoge typisch wären - In den
voice_command-Records werden im Wesentlichen nuruser_prompt,refined_text,web_metadata,external_action,deliverygespeichert
Das erklärt nebenbei auch zwei Punkte, die ich an Typeless gleichzeitig liebe und hasse:
-
Das neu aufpoppende Chat-Fenster hat im Grunde keinen Kontext von davor.
Der Grund ist schlicht: Es ist eher ein „Einweg-Sprachkommando“ als ein fortlaufender Chat-Thread. -
Nachdem es geantwortet hat, kann man nicht entlang der letzten Antwort weiter nachhaken.
Weil die lokale Struktur eben gar nicht für Mehr-Runden-Konversationen gebaut ist, sondern eher nach dem Muster: „Du sagst einen Satz, ich gebe ein Ergebnis, dann ist diese Transaktion beendet.“
Es gibt noch einen sehr entscheidenden harten Beleg:
Als ich bei einer Echtzeitfrage wie „雷神加速器被恶意攻击,攻击者目的是什么?搜一下“ („Der Beschleuniger/Booster ‚Leishen‘ wurde böswillig angegriffen – was war das Ziel der Angreifer? Such mal kurz.“) nachgeschaut habe, tauchte in mode_meta.ai_result.web_metadata im lokal gespeicherten Datensatz Folgendes auf:
grounding_chunksgrounding_supportsvertexaisearch.cloud.google.com/grounding-api-redirect/...
Und in den Quellen konnte man Domains wie sina.com.cn, cnyes.com, youtube.com sehen.
Das zeigt: Zumindest bei einem Teil der „Echtzeit-Info-Fragen“ nutzt es tatsächlich einen Grounding-Ablauf mit Suchquellen – es ist nicht einfach nur ein „seriös wirkendes Live-Erfinden“.
Der verlässlichste Schluss daraus ist daher eigentlich:
Typeless ist eher ein „sprachgesteuertes globales AI-Kommando-Panel“.
Worin es stark ist: schnell, bequem, überall aufrufbar, und es kann den aktuellen UI-Kontext mitnehmen und direkt Ergebnisse liefern.
Worin es nicht stark ist: langen Kontext behalten, um dieselbe Antwort herum wieder und wieder mehrstufig nachfragen.
Sprich: Es ist nicht „ein Voice-ChatGPT-Chatroom“, sondern eine „globale sprachgesteuerte AI-Schnellbedienebene“.
Genau das ist der Grund für das gute Bediengefühl – und auch der Grund, warum man sich beschwert: „Warum kann ich nicht weiterchatten?“
Wenn man diese Art Interaktion mag, habe ich nebenbei auch ein paar ähnliche Produkte überflogen:
- Wispr Flow: am ähnlichsten zu Typeless, eher „globaler Hotkey + Eingabe in beliebige Apps“
- Superwhisper: sehr gut für „Text markieren und dann mit einem Satz umschreiben/fragen“
- Aqua Voice: stärker kontextbewusst
- Braina: eher wie ein klassischer Windows-Sprachassistent plus AI-Schreibassistent
Ein Satz zum Abschluss:
Typeless kann nicht deshalb nicht chatten, weil es „zu schlecht“ wäre – sondern weil es von vornherein nicht als „Chat-Tool“ designt ist; es ist eher ein stets verfügbarer Sprach-AI-„Hilfsarbeiter“, der nach dem Sprechen einfach ausführt.
Wenn ich später weiter tief grabe, will ich am liebsten zwei Dinge im Blick behalten:
- Ob sich aus Debug-Feldern in Serverantworten noch konkretere Provider-Hinweise herauslesen lassen
- Bei welchen Fragen es Suche/Grounding nutzt – und bei welchen Fragen es nur normale Generierung macht