Esta vez revisé Typeless en mi propia máquina como si fuera un pequeño proyecto de detective. El objetivo era muy directo: ¿qué modelo usa exactamente? ¿Por qué su interacción de “pulsas una vez, te escucha hablar y te responde directamente” se siente tan fluida, y por qué justamente no permite repreguntas de varias rondas?
Primero, versión con conclusiones:
- En el cliente local no encontré un nombre de modelo único hardcodeado. No vi cadenas directas como
gpt-4o,claude,gemini. - No es un modelo local: las solicitudes clave van a
https://api.typeless.com, y la entrada principal de IA es/ai/voice_flow. - Su capacidad de “buscar” es real, y en el historial local capturé un registro con
web_metadatadonde aparece directamente un enlace de redirección de grounding devertexaisearch.cloud.google.com. - Pero en la página pública oficial de Typeless también han escrito que usan proveedores LLM de terceros, por ejemplo OpenAI. Así que se parece más a “el servidor cambia capacidades según el escenario”, en vez de que el cliente quede atado a un modelo y lo use para todo.
Las pruebas que encontré en la práctica también son bastante interesantes:
- La ubicación de instalación está en
C:\\Users\\1\\AppData\\Local\\Programs\\Typeless\\Typeless.exe - Los datos de usuario están en
C:\\Users\\1\\AppData\\Roaming\\Typeless.exe - La configuración de atajos es exactamente la que uso normalmente:
RightAltpara grabar,RightAlt+Spacepara el modo sin mantener pulsado - La base de datos local solo tiene una tabla de negocio central
history - No vi tablas de conversación multivuelta como
conversation,thread,message - En los registros
voice_commandbásicamente solo guardanuser_prompt,refined_text,web_metadata,external_action,delivery
Esto también explica de paso los dos puntos que más me generan amor-odio:
-
La nueva ventana de chat que aparece casi no tiene el contexto de la vez anterior.
La razón es simple: se parece más a un “comando de voz de una sola vez”, no a un hilo de chat persistente. -
Después de que responde, no puedes seguir repreguntando en continuidad con la anterior.
Porque en la estructura local no está diseñado como conversación de varias rondas, sino más bien como “dices una frase, yo te doy un resultado, y esta transacción se termina”.
Hay otra prueba clave bastante contundente:
Cuando consulté preguntas en tiempo real tipo “雷神加速器被恶意攻击,攻击者目的是什么?搜一下” (algo como “Leishen Accelerator fue atacado maliciosamente, ¿cuál era el objetivo del atacante? búscalo”), en el mode_meta.ai_result.web_metadata guardado localmente aparecieron:
grounding_chunksgrounding_supportsvertexaisearch.cloud.google.com/grounding-api-redirect/...
Y en las fuentes se ven sitios como sina.com.cn, cnyes.com, youtube.com.
Esto indica que al menos en una parte de las “preguntas de información en tiempo real”, efectivamente pasa por un flujo de grounding con fuentes de búsqueda, y no es simplemente inventar con cara seria en el momento.
Así que la conclusión más fiable de esta vez en realidad es:
Typeless se parece más a un “panel global de comandos de IA por voz”.
En lo que destaca es: rápido, cómodo, lo puedes abrir en cualquier lado, y combina el contexto de la interfaz actual para darte un resultado directo.
En lo que no destaca es: mantener contexto largo y hacer repreguntas multivuelta alrededor de la misma respuesta.
Es decir, no es un “ChatGPT en versión sala de chat por voz”, sino una “capa global de acciones rápidas de IA por voz”.
Esto es precisamente la razón por la que se siente bien, y también la razón por la que dan ganas de quejarse de “¿por qué no puedo seguir conversando?”.
Si te gusta este tipo de interacción, también miré rápidamente productos parecidos:
- Wispr Flow: el más parecido a Typeless, tirando a “tecla global + entrada en cualquier app”
- Superwhisper: muy bueno para “seleccionar texto y con una frase reescribir/preguntar”
- Aqua Voice: con mayor peso en el contexto
- Braina: más como el clásico asistente de voz de Windows más un asistente de escritura con IA
Para cerrar en una frase:
Typeless no es que no sepa chatear: es que directamente no se diseñó como “herramienta de chat”; se parece más a una herramienta de IA por voz tipo “la llamas, la dices, y se pone a trabajar”.
Si después sigo profundizando, lo que más quiero vigilar son dos cosas:
- Si en los campos debug que devuelve el servidor se puede seguir sacando una pista más concreta del provider
- Qué preguntas pasan por búsqueda y cuáles solo pasan por generación normal