Si el agent se centra demasiado en mcp/skill, seguro que se aleja de lo antropomórfico; intercalar capturas de pantalla de forma adecuada es la mejor solución

Siguiendo el artículo anterior, creo que Doubao ya lo ha hecho.