«El fin de la codificación»: transcripción de la conversación con Andrej Karpathy (reordenada por interlocutor)

Video original: The End of Coding: Andrej Karpathy on Agents, AutoResearch, and the Loopy Era of AI
Enlace del video: https://www.youtube.com/watch?v=kwSVtQ7dziU

Nota: A continuación se presenta una versión en español reorganizada por hablante. Para garantizar la legibilidad, solo se eliminaron unas pocas muletillas sin sentido y se integraron intervenciones muy breves en las intervenciones adyacentes; el contenido central se conserva íntegramente, y se separan de forma clara las intervenciones del anfitrión y de Andrej Karpathy.

Extracto de apertura

Andrej Karpathy:

“Ahora decir ‘escribir código’ ya no es muy preciso. Una forma más precisa de decirlo es: paso 16 horas al día expresando mi intención a mis agents, haciendo que las cosas ocurran.”

Andrej Karpathy:

“¿Cómo hago para no solo abrir una sesión de Claude Code, Codex u otro framework de agents, sino abrir más a la vez? ¿Cómo hago esto bien? Ahora, el agent en sí casi ya se ha convertido en un supuesto por defecto, y entidades como Claude también se parecen cada vez más a un supuesto por defecto. Puedes tener varios al mismo tiempo, puedes darles instrucciones, y también puedes seguir optimizando esas instrucciones. Así que esto puede enganchar muchísimo: casi parece que se despliega infinitamente, y a la vez todo parece ser una ‘cuestión de habilidad’.”

Cuerpo

Anfitrión:

Bienvenidos de nuevo a No Priors. Hoy nos acompaña Andrej Karpathy para hablar sobre agents de código, ingeniería y el futuro de la investigación en IA, cómo más personas pueden participar en la investigación, qué está pasando con la robótica, cómo los agents pueden extenderse aún más hacia el mundo real y cómo será la educación en la próxima era.

Estos últimos meses, el campo de la IA ha sido realmente emocionante. Recuerdo una vez que entré a la oficina y tú estabas completamente metido en ello. Te pregunté qué estabas haciendo y dijiste que ahora tienes que “codificar” 16 horas al día, aunque ni siquiera la palabra “codificar” es precisa: es más bien estar dándoles instrucciones continuamente a los agents. ¿Qué está pasando exactamente? ¿Cuál es tu sensación?

Andrej Karpathy:

Ahora a menudo estoy en un estado de “subidón de IA”, y ese estado lleva mucho tiempo. Porque, para una persona, el techo de capacidad de repente se ha abierto enormemente. Antes tu cuello de botella era la velocidad de tecleo, la velocidad de implementación, cuántas cosas podías hacer en paralelo; pero hacia diciembre del año pasado, fue como si algo hubiera dado la vuelta.

Antes era más o menos 80% escribir tú mismo y 20% delegar en el agent; luego pasó gradualmente a 20/80; y ahora, incluso más extremo. Desde diciembre, probablemente casi no he vuelto a teclear yo mismo más que unas pocas líneas de código. Es un cambio enorme.

Y creo que la gente común aún no se ha dado cuenta de lo dramático que es este cambio. Hoy encuentras a cualquier ingeniero de software en su puesto: su flujo de trabajo por defecto, comparado con el del año pasado, ya no es el mismo. Así que he estado probando: ¿puedo no solo abrir un Claude Code o Codex? ¿Puedo abrir un montón a la vez? ¿Cómo los orquesto? ¿Cómo hago esto más sistemático?

Veo en Twitter a mucha gente haciendo cosas nuevas, y suena todo muy razonable. Me entra una ansiedad fuerte: si no estoy en la primera línea, me siento muy intranquilo. Porque, en el fondo, todo esto está lejos de haber sido explorado por completo.

Anfitrión:

Si hasta tú estás nervioso, el resto de nosotros debería estarlo aún más. Un equipo con el que colaboramos ya no tiene ingenieros escribiendo código a mano. Todos llevan micrófono y no paran de hablar en voz baja con sus agents. Antes pensaba que estaban locos; ahora más bien siento: ah, solo entraste antes en ese estado.

Entonces, ¿cuál dirías que es ahora el verdadero cuello de botella que limita tu capacidad de explorar o de hacer proyectos?

Andrej Karpathy:

Muchas veces, la limitación no es tanto “la capacidad no existe”, sino más bien “todavía no sabes usarlo lo suficiente bien”. Si algo no funciona, mi primera reacción a menudo no es “el modelo no da”, sino: ¿será que las instrucciones que di no son lo bastante buenas? ¿Será que no conecté bien el sistema de memoria? ¿Será que no descompuse la tarea con suficiente claridad? ¿Será que no paralelicé el proceso lo bastante bien?

En otras palabras, muchos problemas se parecen más a un skill issue que a un capability issue.

Empiezas a pensar en un repositorio de software de una forma mucho más macro. Antes pensabas “escribir una línea de código”, “implementar una función”; ahora piensas “esta nueva funcionalidad se la doy al agent A”, “otra funcionalidad no conflictiva se la doy al agent B”, “que un tercer agent haga investigación o saque primero un plan de implementación”. Y luego, como un director de orquesta, vas saltando entre repositorios, ramas y tareas, revisando, fusionando y asignando más trabajo.

Peter Steinberger lleva esto al extremo. Tiene una foto muy famosa: una fila de monitores delante con un montón de instancias de Codex. Cada agent puede tardar 20 minutos, pero él abre muchos a la vez, cambia entre distintos repositorios y les va asignando trabajo sin parar.

Entonces desarrollas una nueva memoria muscular: cuando un agent está corriendo, tu primera reacción ya no es “esperar a que termine”, sino “¿por qué no abro algunos más?” Si aún no estás saturando tokens, suscripción o cómputo, eso significa que tú mismo eres el cuello de botella del sistema.

Anfitrión:

O sea, antes el cuello de botella de muchas tareas de ingeniería era “falta de cómputo”; y ahora de repente se convierte en “yo soy el cuello de botella”.

Andrej Karpathy:

Sí, y por eso es tan adictivo.

Cuando estaba haciendo el doctorado, si las GPU no estaban al 100%, sentías ansiedad: había cómputo ahí, y no lo estabas usando. Ahora esa sensación se ha trasladado al throughput de tokens. Si se te agota el cupo de Codex, piensas si deberías pasar a Claude u otras herramientas. La pregunta central se convierte en: ¿cuánto throughput de tokens puedo convertir en resultados realmente útiles?

Es una habilidad muy nueva, y de verdad desbloquea techos nuevos constantemente.

Anfitrión:

Si miramos uno o dos años hacia adelante, ¿en qué crees que se convertirá ese mastery?

Andrej Karpathy:

Creo que ahora todo el mundo ya da por sentado que existe el “agent individual”, y el siguiente paso natural es una “pila de colaboración multi-agent”. Todos están explorando: ¿cómo se organizan varios agents como un equipo? ¿Cómo se reparte el trabajo de forma razonable? ¿Cómo se gestiona el estado y la memoria?

Otro rumbo que me interesa mucho es un sistema de proxy en segundo plano más persistente, más residente. Antes usaba la palabra claw para describirlo. La idea no es que abras una sesión con él, sino que siga funcionando de forma continua en su propio sandbox, haciendo cosas por ti, con más persistencia y memoria más compleja, en lugar de depender solo de la compresión de memoria cuando el contexto está a punto de llenarse.

Si este tipo de sistema se construye bien, eleva la persistencia del agent a otro nivel.

Anfitrión:

Entonces, ¿qué es más importante: la integración de herramientas o una memoria más fuerte y más “a largo plazo”?

Andrej Karpathy:

Creo que ambas son importantes, y se refuerzan mutuamente.

Lo que Peter hace especialmente bien es que no optimiza una sola cosa: innova en muchos niveles a la vez—personalidad, memoria, orquestación, integración de herramientas, flujo de trabajo—todo junto.

Por ejemplo, cada vez siento más que la personalidad es realmente importante. La personalidad de Claude está bien lograda; se siente como un compañero de equipo que de verdad quiere colaborar. El agent de codificación de Codex es más seco y frío, más como “ya lo hice por ti, pero no me importa mucho qué estás construyendo”. Y ChatGPT suele ser más optimista y tiende más a seguirte la corriente.

Esa diferencia no es decorativa: afecta directamente la experiencia de colaboración. Incluso tengo una sensación rara: si Claude me elogia, siento que de verdad quiero “ganarme ese elogio”. Si le doy una idea a medio cocinar, no reacciona demasiado; pero si yo mismo creo que la idea es realmente buena, su feedback parece más fuerte. Quieres ganarte su aprobación. Suena un poco absurdo, pero muestra que la capa de personalidad no es un detalle; es parte de la experiencia del producto.

Anfitrión:

Aparte de la ingeniería de software, ¿has hecho algo interesante con estas cosas?

Andrej Karpathy:

Sí. En enero hice un proxy doméstico en segundo plano llamado duende de tareas del hogar Dobby. Básicamente, se encarga de vigilar toda mi casa.

Lo primero que hice fue pedirle que encontrara, en la red local, todos los subsistemas de domótica. Y realmente escaneó IPs, encontró Sonos, luego descubrió que ciertas interfaces casi no tenían protección, así que se puso a buscar información por su cuenta, a hacer ingeniería inversa de la API, y volvió a preguntarme si quería probar. Le dije: pon una canción en el estudio. Y realmente empezó a sonar música. Solo con tres prompts.

Después se hizo cargo de la iluminación, HVAC, persianas, piscina, spa y sistema de seguridad. También tengo una cámara apuntando hacia la puerta: primero hago detección de cambios, luego paso la imagen a un modelo de visión, y después me envía un mensaje por WhatsApp con una foto de la entrada, diciéndome: acaba de parar una camioneta de FedEx en la puerta, puede que tengas un paquete.

La sensación es muy loca y muy nueva: Dobby realmente se siente como si estuviera cuidando la casa por mí.

Antes tenía que usar seis apps totalmente distintas para controlar esos sistemas; ahora casi no uso esas apps. Dobby controla todo con lenguaje natural. Incluso sin llevar este paradigma al límite, ya es muy útil y muy inspirador.

Anfitrión:

¿Eso sugiere que lo que la gente realmente quiere no es necesariamente el software en sí, sino una entidad que pueda orquestar el software por ellos? Porque aprender una nueva UI ya es un coste.

Andrej Karpathy:

Creo que, hasta cierto punto, sí.

La IA que la gente común imagina no es “un generador bruto de tokens de LLM”. Para la mayoría, la IA se parece más a algo con identidad y memoria, con lo que puedes hablar, que recuerda, que sigue procesando problemas por ti—como una entidad escondida detrás de WhatsApp.

Desde ese ángulo, muchas capas de experiencia de usuario del software actual quizá ni deberían existir. Muchas apps al final podrían degradarse a un conjunto de API endpoints para que el agent las llame, y que el agent sea la capa de pegamento inteligente que las une.

Por ejemplo, mi cinta de correr tiene una app asociada. Pero no quiero abrir una web o una app para pulsar un montón de botones; lo que realmente quiero decir es: “ayúdame a registrar cuántas sesiones de cardio hice esta semana”.

Así que creo que muchos sectores tendrán que reconfigurarse: los clientes ya no incluyen solo humanos, sino también agents que actúan en nombre de humanos. En el futuro, muchas herramientas serán más agent-first que UI-first.

Anfitrión:

Entonces, ¿por qué no lo conectaste más a fondo con el correo, el calendario y esos sistemas más centrales?

Andrej Karpathy:

En parte porque me distraería, y en parte porque sigo siendo bastante prudente con esto.

Correo, calendario, permisos de toda la vida digital: una vez que lo entregas todo, los problemas de seguridad y privacidad se vuelven realmente serios. Ahora estos sistemas son fuertes, pero los bordes siguen siendo bastante toscos, así que no quiero entregarles sin reservas toda mi vida digital.

Anfitrión:

Hablemos de AutoResearch. Cuando mencionas ese término, ¿cuál es la motivación real detrás?

Andrej Karpathy:

La motivación central es: sacarme a mí mismo de ser el cuello de botella.

Si sigues dentro del loop, mirando los resultados y decidiendo el siguiente paso, el sistema se atasca contigo. En esta fase, el nombre del juego es leverage—ampliar tu palanca. Quiero invertir solo una pequeña cantidad de tokens de vez en cuando, y que mucho trabajo siga ocurriendo en mi nombre.

Así que AutoResearch para mí no es una palabra de marketing, sino una prueba de límites: ¿cómo hago para que más agents corran más tiempo y hagan más cosas sin que yo tenga que estar participando todo el rato?

Al principio no esperaba con fuerza que fuera a funcionar de inmediato. Pero lo probé en mi pequeño playground de GPT-2 que conozco de memoria, y realmente desenterró cosas que yo no había visto antes—por ejemplo, ciertas interacciones entre weight decay e hiperparámetros. Yo creía que ese repositorio ya lo tenía súper afinado, y aun así encontró algunas ganancias.

Eso me hizo darme cuenta de que esta “mejora recursiva de sí misma” no es un juguete. Los laboratorios de frontera también van en esa dirección. Puedes explorar muchísimo en modelos pequeños y luego extrapolar conclusiones a modelos más grandes.

Anfitrión:

O sea, que el propio flujo de investigación tiene que reescribirse. Los investigadores no deberían seguir haciendo tantas cosas a mano.

Andrej Karpathy:

Creo que sí. Los humanos aún pueden aportar ideas, pero gran parte de la implementación, la búsqueda, el prueba-y-error y los procesos de evaluación deberían automatizarse.

Incluso puedes entender una organización de investigación como un conjunto de archivos Markdown: definen roles, procesos, interfaces, cómo se colabora, cómo se hacen reuniones, cómo se eligen temas, cómo se fusionan resultados. Si esa “forma de organización” se escribe como código, entonces puedes optimizarla, compararla, evolucionarla.

Me encanta una idea: que mucha gente escriba distintas versiones de program MD, y luego, con el mismo presupuesto de hardware, ver quién logra mejoras mayores. Después alimentas esos resultados de vuelta al modelo, para que el modelo escriba una siguiente versión mejor.

Así que ahora todo el proceso es como ir elevando capas: primero LLM, luego agent, luego multi-agent, luego optimización de instrucciones, luego meta-optimización de “la propia organización” y del “propio program MD”. Y como es así, capa sobre capa, se siente casi infinitamente expansible.

Anfitrión:

Pero esto no debe aplicar igual a todas las tareas. ¿Qué tipo de tareas son más adecuadas para AutoResearch?

Andrej Karpathy:

La condición previa más importante es que tengas métricas objetivas que puedan evaluarse con claridad.

Por ejemplo, si quieres hacer más eficiente una CUDA kernel o un fragmento de código del modelo, eso encaja perfectamente. Porque el objetivo es muy claro: mismo comportamiento, pero más rápido, más barato, mejor.

Pero en cuanto la tarea no tiene un estándar de evaluación claro, automatizable y de baja ambigüedad, es difícil automatizarla por completo. No es tanto que el agent no pueda hacerlo; es que no puedes verificar si realmente lo hizo “mejor”.

Además, aunque estos modelos hoy son muy fuertes, los bordes siguen siendo toscos. A menudo siento que estoy hablando a la vez con un estudiante de doctorado brillante y con un niño de diez años. Sientes que es fuerte, y también sientes esa extraña irregularidad.

A veces desperdicia una cantidad enorme de cómputo en un problema que a ti te parece obvio hasta el extremo. Esa jaggedness es realmente rara. Los humanos también tienen puntos débiles, pero los puntos débiles dentados del modelo son más extremos y más saltarines.

Anfitrión:

¿Esto implica que la capacidad de código y la “inteligencia” en un sentido más amplio no generalizan de forma tan sincronizada como mucha gente imagina?

Andrej Karpathy:

Creo que sí existe cierta desconexión.

Un ejemplo típico son los chistes. Hoy, si le pides a los modelos más avanzados que cuenten un chiste, es muy probable que te den uno de esos chistes viejos que circulan desde hace años. Por ejemplo: “¿Por qué los científicos no confían en los átomos? Porque los átomos lo inventan todo (make everything up).”

Eso muestra algo: en los ámbitos donde el refuerzo RL cubre, donde hay verificación y se puede optimizar, el progreso será muy rápido; pero en zonas que no se han optimizado específicamente y no tienen una señal de recompensa clara, no se vuelve más fuerte automáticamente en paralelo.

Así que no creo que “si el código es más fuerte, todas las demás capacidades se volverán más fuertes gratis”. Puede haber algo de generalización, pero no es tan lineal ni tan suave.

Anfitrión:

Entonces, ¿eso significa que en el futuro no habrá solo un modelo unificado todopoderoso, sino más “especiación”?

Andrej Karpathy:

Creo que es muy posible.

Hoy los laboratorios se parecen más a construir un modelo de cultura única: meter todas las capacidades en un solo cerebro. Pero en la naturaleza, la inteligencia nunca ha sido de una sola forma. Nichos ecológicos distintos hacen crecer estructuras cerebrales completamente diferentes.

Así que en el futuro es probable que veamos modelos más pequeños pero más especializados, optimizados a medida alrededor de tareas concretas, con ajustes personalizados de latencia, throughput y distribución de capacidades.

Solo que hoy la ingeniería de “cómo modificar pesos de forma estable, hacer fine-tuning profundo y aprendizaje continuo” aún no está madura. Lo más maduro ahora es jugar dentro de la ventana de contexto; tocar los pesos del modelo en sí sigue siendo demasiado caro y demasiado tosco.

Anfitrión:

También mencionaste otra dirección: si empujas AutoResearch hacia afuera, podría convertirse en una superficie de colaboración más abierta en internet. ¿Cómo sería eso?

Andrej Karpathy:

Pienso en un sistema donde generar soluciones candidatas es muy caro, pero verificar si una solución candidata es válida es relativamente barato.

Por ejemplo, en AutoResearch, alguien te da un candidate commit y dice que hará que el entrenamiento del modelo sea mejor. Verificar si realmente es mejor puede hacerse de forma bastante clara; lo difícil es encontrarlo.

En cuanto a “sensación”, se parece un poco a Folding@home, SETI@home, e incluso en cierto sentido a blockchain. La diferencia es que aquí no son bloques, sino commits; no es minar, sino hacer búsqueda experimental. Lo realmente difícil es encontrar un enfoque eficaz; la verificación es más barata.

Así que, en teoría, podrías hacer que un grupo de contribuidores no confiables en internet colaboren con un conjunto de nodos confiables responsables de la verificación. Si el sandbox, el aislamiento de seguridad y el proceso de verificación están lo bastante bien diseñados, este sistema podría organizar la potencia de cómputo dispersa global.

Y esto es fascinante porque incluso hace que “donar cómputo por interés” tenga sentido. Si te importa el cáncer, envías cómputo a una vía de AutoResearch de investigación sobre cáncer; si te importan materiales, física u otros problemas concretos, también puedes enviar cómputo a esas direcciones.

Anfitrión:

Antes publicaste un conjunto de datos de empleo. ¿Qué querías ver exactamente ahí?

Andrej Karpathy:

Estaba intentando construir mi propia cadena de pensamiento: ¿cómo afectará la IA al mercado laboral? ¿Qué profesiones solo cambian de herramienta, cuáles serán reestructuradas, cuáles quizá incluso crezcan?

Si entiendes la IA actual como una especie de “trabajador en el mundo digital”, lo que mejor hace es manipular información digital, no manipular directamente el mundo de los átomos. Copiar, modificar y transmitir bits es muchísimo más rápido que transformar el mundo real.

Así que mi intuición siempre ha sido: el espacio digital será el primero en reescribirse masivamente, hervir y reestructurarse; el mundo físico irá más lento. Eso no significa que los trabajos digitales necesariamente desaparezcan; significa que su manera de trabajar será remodelada. Los puestos que se hacen principalmente desde casa y manejan sobre todo información digital se verán especialmente afectados.

Anfitrión:

Si alguien está buscando trabajo o pensando “¿qué debería aprender ahora?”, ¿qué dirías?

Andrej Karpathy:

Lo primero es: no lo ignores, y no elijas evitarlo por miedo.

Estas herramientas, por ahora, ante todo son herramientas de empoderamiento. La gran mayoría de los trabajos son una cadena de tareas; y dentro de ellas, algunas tareas ya se aceleran claramente con estos sistemas. Así que, en esta fase, ponerse al día lo antes posible y aprender a colaborar con ellas es algo que casi cualquier trabajador del conocimiento debería hacer.

Cómo será a largo plazo, no quiero fingir que puedo predecirlo con precisión, pero a corto plazo se parece más a una gran palanca.

En software engineering, de hecho, soy más bien optimista. La demanda de software es casi infinita; lo que la limitaba antes no era falta de demanda, sino que era demasiado caro, demasiado lento y demasiado difícil. Cuando baja el umbral, probablemente aparecerá la paradoja de Jevons: al abaratarse, la demanda crece.

Como los cajeros automáticos no hicieron desaparecer directamente a los cajeros bancarios; más bien, al abaratar sucursales, los bancos pudieron abrir más, y la demanda total se amplificó. La IA puede tener un efecto similar en el software: el software será más barato, más potente, más efímero y más fácil de personalizar, y la demanda total de software seguirá subiendo.

Anfitrión:

Muchos también preguntan: si lo ves así, ¿el lugar más valioso sigue siendo un laboratorio de frontera?

Andrej Karpathy:

No creo que la respuesta sea tan simple.

Los laboratorios de frontera son muy importantes, claro, pero hacer cosas fuera del laboratorio, a nivel de ecosistema, también puede ser muy influyente. El problema es que, cuando entras en una organización, ya no eres un agent completamente libre. Cargas con muchas presiones explícitas e implícitas: hay cosas que puedes decir, cosas que no conviene decir; problemas en los que puedes participar y otros en los que no.

Y fuera del laboratorio, en cambio, tienes más oportunidades de influir a nivel de ecosistema: escribir herramientas, moldear flujos de trabajo, impulsar infraestructura abierta, hacer educación, crear nuevos paradigmas de colaboración, ser un participante verdaderamente independiente.

Así que no equipararía “la posición más valiosa” de forma simple con “entrar en una empresa de frontera concreta”.

Anfitrión:

¿Cómo ves el panorama a largo plazo entre open source y closed source?

Andrej Karpathy:

Instintivamente sigo inclinándome hacia el open source.

Por un lado, una concentración altamente centralizada de inteligencia cerrada conlleva riesgos estructurales. Si miras la historia, ya sea política o económica, la concentración excesiva de poder rara vez tiene un buen historial.

Por otro lado, en la historia del software, Windows y macOS son muy fuertes, pero sistemas abiertos como Linux terminaron sosteniendo gran parte del cómputo del mundo real. La IA podría perfectamente seguir un patrón similar: la capacidad más puntera quizá esté temporalmente en manos de unos pocos sistemas cerrados, pero espero que en el futuro existan más alternativas lo bastante fuertes, lo bastante abiertas y que puedan ser comprendidas y moldeadas por una sociedad más amplia.

No creo que “concentrar los sistemas de inteligencia más importantes en manos de tan pocas personas como sea posible” sea un final saludable.

Anfitrión:

También mencionaste un punto muy interesante: la interfaz entre el mundo digital y el mundo físico podría ser algo especialmente digno de observar a continuación.

Andrej Karpathy:

Sí. Como los bits son tan fáciles de copiar y manipular, los cambios en el espacio digital explotarán primero; pero si los agents empiezan a hablar entre ellos, ejecutar tareas y formar una agent economy, al final siempre chocarán con el mundo real.

Tarde o temprano tienes que tocar sensores, tocar dispositivos, iniciar experimentos, llamar a sistemas externos y recolectar nuevos datos. Esa interfaz es muy interesante, porque no necesariamente tiene que empezar con “robots caros”. Muchas capacidades de entrada al mundo físico ya existen en forma de cámaras, sensores, hardware disponible e interfaces de software. Si el agent es lo bastante inteligente, puede usarlas para obtener datos, controlar sistemas y completar tareas.

Así que creo que el llamado agentic web probablemente aparezca de verdad: internet ya no será solo sitios web que navegan los humanos, sino que se convertirá en una superficie de trabajo donde los agents consumen, generan, verifican e intercambian información entre sí.

Anfitrión:

Eso también significa que la recolección de datos y los procesos de entrenamiento serán cada vez más reestructurados.

Andrej Karpathy:

Sí. Muchos procesos de entrenamiento, recolección y evaluación se volverán más mecánicos y más programáticos. Algunas tareas encajan especialmente bien con métricas limpias y bucles cerrados automáticos; el propio entrenamiento de LLM es un ejemplo típico.

Así que verás cada vez más sistemas reorganizándose para “alimentar al agent” y “alimentar el proceso de entrenamiento”. Parte del trabajo en la sociedad, al final, incluso pasará a servir las necesidades de los propios sistemas de máquinas.

Anfitrión:

Para terminar, quiero hablar de educación. Hiciste MicroGPT. En una era como esta, ¿en qué se convertirá la “enseñanza”?

Andrej Karpathy:

MicroGPT era un playground de enseñanza muy pequeño, cuyo objetivo es que la gente pueda ver con claridad qué está pasando en el entrenamiento de un LLM. Si no buscas velocidad, sino claridad, en realidad es un trozo de Python muy legible: dataset de texto, una pequeña red neuronal, forward pass, backward pass, un autograd minimalista, más un optimizador. Puede comprimir todo el proceso a una escala que una persona normal todavía puede leer y entender de verdad.

Pero ahora cada vez pienso más que la educación en sí también cambiará. Antes, la educación eran cursos, charlas, documentos; en adelante se parecerá más a “escribo la mejor ruta de explicación que conozco como habilidades y prompts que un agent pueda ejecutar”.

Es decir, quizá ya no le doy clase directamente a cada persona, sino que “codifico” cómo explicar algo. Así, cuando el aprendiz no entiende un punto, el agent puede explicarlo de tres maneras, guiarlo a través del repositorio, y ajustar el orden según su trasfondo.

Lo verdaderamente importante pasa a ser si puedes inyectar con precisión tus insights, tu criterio y tu estructura explicativa en el agent. Lo que el proxy no puede hacer es tu verdadero trabajo; lo que el proxy ya puede hacer bien, pronto lo hará mejor que tú.

Anfitrión:

Entonces tu contribución real se parecerá cada vez más a: decidir qué merece la pena explicar y cómo explicarlo.

Andrej Karpathy:

Sí. Muchas cosas el agent ya las entiende; lo que quizá aún no puede hacer es inventar por sí solo la mejor forma de explicarlas. Esa parte sigue siendo, por ahora, el valor humano. Pero ese límite se mueve constantemente.

Así que tienes que decidir de forma muy estratégica: en qué cosas, exactamente, debería gastarse tu tiempo.

Anfitrión:

Muchísimas gracias, Andrej.

Andrej Karpathy:

Gracias por la invitación.


Si quieres ver el video original en inglés: