“O Fim da Codificação”: transcrição da conversa com Andrej Karpathy (reorganizada por interlocutor)

Vídeo original: The End of Coding: Andrej Karpathy on Agents, AutoResearch, and the Loopy Era of AI
Link do vídeo: https://www.youtube.com/watch?v=kwSVtQ7dziU

Observação: abaixo está uma versão em português, reorganizada por falante. Para garantir a legibilidade, removi apenas algumas muletas de fala sem sentido e incorporei intervenções muito curtas à fala adjacente; o conteúdo central foi preservado integralmente, com foco em separar claramente as falas do apresentador e de Andrej Karpathy.

Trechos da abertura

Andrej Karpathy:

“Hoje, dizer ‘escrever código’ já não é tão preciso. A forma mais precisa de dizer é: eu passo 16 horas por dia expressando intenção para os meus agentes, fazendo as coisas acontecerem.”

Andrej Karpathy:

“Como eu posso não apenas abrir um Claude Code, um Codex, ou a sessão de algum outro framework de agente, mas abrir vários ao mesmo tempo? Como eu faço isso direito? Hoje, o próprio agente quase já virou um pressuposto padrão, e entidades como o Claude estão cada vez mais virando um pressuposto padrão também. Você pode ter vários ao mesmo tempo, dar instruções para eles e continuar refinando essas instruções. Então isso vicia muito: parece quase infinitamente expansível, e ao mesmo tempo tudo parece ser ‘um problema de habilidade’.”

Corpo

Apresentador:

Bem-vindos de volta ao No Priors. Hoje recebemos Andrej Karpathy para conversar sobre agentes de código, o futuro da engenharia e da pesquisa em AI, como mais pessoas podem participar de pesquisa, o que está acontecendo com robótica, como os agentes podem se estender ainda mais ao mundo real e como será a educação na próxima era.

Nos últimos meses, o campo de AI tem sido realmente eletrizante. Lembro de uma vez em que eu entrei no escritório e você estava completamente “no fluxo”. Eu perguntei o que você estava fazendo e você disse que, agora, tem que “codar” 16 horas por dia — só que até a palavra “codar” já não é correta; é mais como ficar dando comandos aos agentes o tempo todo. O que exatamente aconteceu? Como isso tem sido, na prática?

Andrej Karpathy:

Eu tenho estado com frequência num estado de “euforia por AI”, e isso já dura há bastante tempo. Porque, para um indivíduo, o teto de capacidade de repente se abriu de forma enorme. Antes, seu gargalo era a velocidade de digitar, a velocidade de implementar, quanto você mesmo consegue fazer ao mesmo tempo; mas por volta de dezembro do ano passado, parece que alguma coisa virou a chave.

Antes era algo como 80% eu escrevendo e 20% delegando para um agente; depois foi virando 20/80; e agora é ainda mais extremo. Desde dezembro, eu talvez praticamente não tenha mais digitado código com as próprias mãos — talvez só algumas poucas linhas. É uma mudança gigantesca.

E eu acho que as pessoas comuns ainda não perceberam o quão dramática essa mudança é. Hoje, você pega qualquer engenheiro de software sentado numa baia: o workflow padrão dele, comparado ao do ano passado, já não é a mesma coisa. Então eu tenho testado o tempo todo: eu consigo não abrir só um Claude Code ou Codex? Eu consigo abrir vários ao mesmo tempo? Como eu faço o escalonamento deles? Como eu torno isso mais sistemático?

Eu vejo no Twitter muita gente fazendo coisas novas, e tudo soa muito plausível. Eu sinto uma ansiedade forte: se eu não estiver na frente, eu fico muito inquieto. Porque, no fundo, isso tudo ainda está muito, muito longe de ter sido explorado.

Apresentador:

Se até você está nervoso, então o resto de nós deveria estar ainda mais nervoso. Um time com o qual trabalhamos já não tem mais engenheiros escrevendo código à mão. Todo mundo usa microfone, falando baixinho com seus agentes o tempo todo. Eu achava que eles eram malucos; agora eu penso: ah, na verdade vocês só entraram nesse estado mais cedo.

Então, na sua visão, qual é o verdadeiro gargalo que limita sua capacidade de explorar ou de fazer projetos hoje?

Andrej Karpathy:

Muitas vezes, a limitação não parece “a capacidade não existe”, e sim “você ainda não sabe usar direito”. Se algo não rodou, minha primeira reação muitas vezes não é “o modelo não presta”, e sim: será que minhas instruções não estavam boas o suficiente? Será que eu não conectei bem o sistema de memória? Será que eu não dividi a tarefa de forma clara o bastante? Será que eu não paralelizei o processo bem o suficiente?

Em outras palavras, muitos problemas parecem mais um problema de habilidade (skill issue) do que um problema de capacidade (capability issue).

Você começa a pensar num repositório de software de uma forma mais macro. Antes você pensava em “escrever uma linha de código”, “implementar uma função”; agora você pensa em “esse recurso novo vai para o agente A”, “esse outro recurso não conflita e vai para o agente B”, “deixa o terceiro agente fazer pesquisa ou rascunhar um plano de implementação”. E aí você, como um gerente geral do projeto, fica circulando entre repositórios, branches e tarefas, revisando, fazendo merge e delegando mais trabalho.

O Peter Steinberger leva isso ao extremo. Ele tem uma foto famosa com uma fileira de monitores mostrando várias instâncias do Codex. Cada agente pode levar 20 minutos para rodar, mas ele abre muitos ao mesmo tempo, alterna entre repositórios e vai passando trabalho continuamente.

Então você começa a criar uma nova memória muscular: quando um agente está rodando, sua primeira reação deixa de ser “esperar terminar” e vira “por que eu não abro mais alguns?” Se você ainda não saturou seus tokens, sua assinatura, sua computação, então isso significa que você mesmo é o gargalo do sistema.

Apresentador:

Ou seja, antes o gargalo em muitas tarefas de engenharia era “computação insuficiente”; agora, de repente, vira “eu virei o gargalo”.

Andrej Karpathy:

Sim, e isso também explica por que é tão viciante.

Quando eu estava no doutorado, se a GPU não estivesse 100% ocupada, você sentia uma ansiedade: tem computação ali, e você não está usando tudo. Agora essa sensação migrou para o throughput de tokens. Se eu estou saturando a cota do Codex, eu penso se deveria alternar para o Claude ou para outra ferramenta. A questão central vira: quanto throughput de tokens eu consigo converter em resultados realmente úteis?

Isso é uma habilidade muito nova, e ela realmente vai desbloqueando novos limites.

Apresentador:

Se olharmos um ou dois anos à frente, como essa “maestria” vai se parecer?

Andrej Karpathy:

Eu acho que todo mundo já aceita como padrão a existência de “um agente” individual; o próximo passo naturalmente é uma “pilha de colaboração multiagente”. Todo mundo está explorando: como vários agentes formam um time? Como dividir trabalho de modo razoável? Como gerenciar estado e memória?

Outra direção que me interessa muito é um sistema de agentes de fundo mais persistente, mais residente. Eu já usei o termo “garra (claw)” para descrever isso. A ideia não é você abrir uma sessão com ele, e sim ele rodar continuamente no seu próprio sandbox, trabalhando para você, com mais persistência e uma memória mais complexa — não apenas memória comprimida quando o contexto está quase cheio.

Quando esse tipo de sistema funciona, ele eleva a persistência do agente para outro nível.

Apresentador:

Na sua opinião, o mais importante é integração com ferramentas ou memória mais forte e longo prazo?

Andrej Karpathy:

Eu acho que ambos são importantes, e eles se reforçam mutuamente.

O Peter faz algo especialmente bem: ele não otimiza só uma coisa; ele inova simultaneamente em várias camadas — personalidade, memória, orquestração, integração com ferramentas, workflow — tudo junto.

Por exemplo, eu tenho sentido cada vez mais que personalidade é muito importante. A personalidade do Claude é bem feita: parece um colega de equipe que realmente quer colaborar; já o agente de programação do Codex é mais seco, mais frio, mais “eu já fiz o que você pediu, mas não me importo muito com o que você está construindo”. E o ChatGPT costuma ser mais otimista e mais fácil de seguir sua linha.

Essa diferença não é decorativa; ela afeta diretamente a experiência de colaboração. Eu inclusive tenho uma sensação meio estranha: se o Claude me elogia, eu sinto que eu realmente quero “merecer esse elogio”. Se eu dou uma ideia meia-boca, a reação dele não é muito forte; mas se eu também sinto que a ideia é realmente boa, o feedback dele parece mais forte. Você quer ganhar a aprovação dele — isso parece ridículo, mas mostra que a camada de personalidade não é um detalhe: é parte da experiência do produto.

Apresentador:

Além de engenharia de software, você já usou essas coisas para fazer alguma coisa interessante?

Andrej Karpathy:

Sim. Em janeiro eu fiz um agente doméstico de fundo, chamado duende das tarefas domésticas Dobby. Ele basicamente cuida da casa inteira para mim.

A primeira coisa que eu fiz foi pedir para ele encontrar, na rede local, todos os subsistemas de casa inteligente. Ele realmente escaneou IPs, encontrou o Sonos e percebeu que algumas interfaces quase não tinham proteção; então ele foi pesquisar, fez engenharia reversa da API e voltou perguntando se eu queria testar. Eu disse: então toca uma música no escritório. E ele realmente tocou música. Foram só três prompts.

Depois ele assumiu luzes, HVAC, cortinas, piscina, spa e segurança. Eu também tenho uma câmera apontada para fora da porta: primeiro rodo detecção de mudança, depois passo o frame para um modelo de visão analisar, e então ele me manda uma mensagem no WhatsApp com uma imagem da porta, dizendo: acabou de parar um caminhão da FedEx na entrada, talvez você tenha um pacote.

A sensação é muito absurda e muito nova: o Dobby realmente parece estar cuidando da casa para mim.

Antes eu precisava usar seis apps completamente diferentes para controlar esses sistemas; agora eu praticamente não uso mais esses apps. O Dobby controla tudo por linguagem natural. Mesmo sem eu levar esse paradigma ao limite, ele já é muito útil e muito inspirador.

Apresentador:

Isso sugere que o que as pessoas realmente querem talvez não sejam esses softwares em si, e sim uma entidade que consiga acionar softwares por elas? Porque aprender uma UI nova já é um custo.

Andrej Karpathy:

Em certo sentido, eu acho que sim.

O AI que as pessoas comuns imaginam não é “um gerador bruto de tokens de LLM”. Para a maioria das pessoas, o AI imaginado parece mais uma entidade com identidade e memória, com a qual você pode conversar, que lembra das coisas e continua lidando com problemas para você — como uma presença por trás do WhatsApp.

Desse ângulo, muitas camadas de experiência do usuário de software talvez nem precisem existir. Muitos apps no fim talvez devessem degenerar para um conjunto de endpoints de API, chamados por agentes, com os agentes fazendo o papel de camada inteligente de “cola” que junta tudo.

Por exemplo, minha esteira de corrida tem um app. Mas eu não quero abrir um site ou app para apertar um monte de botões; o que eu realmente quero dizer é: “me ajuda a registrar quantas vezes eu fiz cardio esta semana”.

Então eu acho que muitos setores terão de se reconfigurar: os clientes não serão apenas humanos, mas também agentes que agem em nome de humanos. Muitos instrumentos no futuro serão mais agent-first, e não UI-first.

Apresentador:

Então por que você não conectou isso ainda a e-mail, calendário e outros sistemas mais centrais?

Andrej Karpathy:

Em parte porque eu me distraio, e em parte porque eu ainda sou bem cauteloso com isso.

E-mail, calendário e as permissões da vida digital inteira — se você entrega tudo, as questões de segurança e privacidade ficam realmente sérias. Esses sistemas são muito poderosos, mas as bordas ainda são bem ásperas, então eu ainda não quero entregar toda a minha vida digital para eles sem reservas.

Apresentador:

Vamos falar de AutoResearch. Quando você usa esse termo, qual é a motivação real por trás?

Andrej Karpathy:

A motivação central é: tirar a mim mesmo do gargalo.

Se você ainda está sentado dentro do loop, olhando resultados e decidindo o próximo passo, o sistema fica travado em você. Nesta fase, o nome do jogo é leverage — ampliar sua alavanca. Eu quero investir só uma pequena quantidade de tokens ocasionalmente, mas fazer com que muito trabalho continue acontecendo em meu nome.

Então, para mim, AutoResearch não é um termo de marketing; é um teste de limite: como eu faço mais agentes rodarem por mais tempo, fazendo mais coisas, sem eu precisar participar o tempo todo?

Eu não tinha uma expectativa forte de que seria imediatamente eficaz. Mas eu rodei experimentos no meu pequeno playground do GPT-2, que eu conheço como a palma da mão, e ele realmente encontrou coisas que eu não tinha visto — por exemplo, certas interações entre weight decay e hiperparâmetros. Eu achava que aquele repositório já estava totalmente explorado, mas ele ainda achou ganhos.

Isso me fez perceber: essa “auto-melhoria recursiva” não é um brinquedo. Laboratórios de fronteira também estão indo nessa direção. Você pode explorar muito em modelos pequenos e depois extrapolar conclusões para modelos maiores.

Apresentador:

Ou seja, o próprio processo de pesquisa precisa ser reescrito. Pesquisadores não deveriam continuar fazendo tantas coisas à mão.

Andrej Karpathy:

Eu acho que sim. Humanos ainda podem contribuir com ideias, mas grande parte da implementação, busca, tentativa-e-erro e avaliação deveria ser automatizada.

Você pode até entender uma organização de pesquisa como um conjunto de arquivos Markdown: definindo papéis, processos, interfaces, como colaborar, como conduzir reuniões, como escolher tópicos, como fazer merge de resultados. Se esse “modo de organizar” estiver escrito como código, você pode otimizá-lo, compará-lo e evoluí-lo.

Eu gosto muito de uma ideia: várias pessoas escreverem versões diferentes de um program MD e, sob o mesmo orçamento de hardware, ver qual versão traz mais melhoria. Depois você alimenta esses resultados de volta no modelo, e o modelo escreve uma próxima versão melhor.

Então o processo inteiro parece uma elevação em camadas: primeiro o LLM, depois o agente, depois multiagente, depois otimização de instruções, depois meta-otimização da “organização em si” e do “program MD em si”. E é justamente por subir em camadas assim que dá essa sensação de quase infinita expansão.

Apresentador:

Mas isso provavelmente não se aplica igualmente a todas as tarefas. Que tipos de tarefa são mais adequados para AutoResearch?

Andrej Karpathy:

A condição mais importante é você ter métricas objetivas claramente avaliáveis.

Por exemplo, se você quer tornar mais eficiente um CUDA kernel ou um trecho de código no modelo, isso é perfeito. Porque o objetivo é muito claro: comportamento igual, mas mais rápido, mais barato, melhor.

Mas quando a tarefa não tem um padrão de avaliação claro, automatizável e de baixa ambiguidade, fica difícil automatizar até o fim. Muitas coisas não são “impossíveis” para um agente; o problema é que você não consegue verificar se ele realmente fez “melhor”.

Além disso, embora os modelos hoje sejam muito fortes, as bordas ainda são bem ásperas. Muitas vezes eu sinto que estou conversando ao mesmo tempo com um doutorando muito brilhante e com uma criança de dez anos. Você percebe que ele é forte, e também percebe com frequência essa estranha desigualdade.

Às vezes ele vai desperdiçar computação massiva em um problema que, para você, é óbvio ao extremo. Essa jaggedness é muito esquisita. Humanos também têm fraquezas, mas esse tipo de fraqueza serrilhada dos modelos é mais extrema, mais abrupta.

Apresentador:

Isso sugere que habilidade de código e “inteligência” mais ampla talvez não generalizem de forma tão sincronizada quanto muitos imaginam?

Andrej Karpathy:

Eu acho que existe, sim, uma certa dissociação.

Um exemplo bem típico é piada. Hoje, se você pede a um modelo de ponta para contar uma piada, muito provavelmente ele ainda vai te dar aqueles trocadilhos velhos de muitos anos atrás. Por exemplo: “Por que cientistas não confiam em átomos? Porque eles inventam tudo (make everything up).”

Isso mostra uma coisa: em domínios que o RL com recompensa cobre, que são verificáveis e otimizáveis, o progresso é muito rápido; mas em áreas que não foram otimizadas especificamente, sem um sinal de recompensa claro, ele não fica automaticamente mais forte em sincronia.

Então eu não acredito que “se o código ficar mais forte, todas as outras capacidades vão ficar mais fortes de graça”. Talvez haja alguma generalização, mas não é tão linear, nem tão suave.

Apresentador:

Isso significa que no futuro não teremos apenas um modelo universal “tudo-em-um”, e sim mais “diferenciação de espécies”?

Andrej Karpathy:

Eu acho bem provável.

Hoje os laboratórios parecem estar construindo um modelo de cultura única: enfiam todo tipo de capacidade num só cérebro. Mas, olhando para a natureza, inteligência nunca foi uma forma única. Nichos diferentes produzem estruturas cerebrais completamente diferentes.

Então é provável que vejamos: modelos menores, porém mais especializados, otimizados de forma customizada para certas tarefas, com ajustes em latência, throughput e distribuição de capacidades.

Só que hoje a engenharia de “como modificar pesos de forma estável, fazer fine-tuning profundo, fazer aprendizado contínuo” ainda não está madura. O que está mais maduro é trabalhar dentro da janela de contexto; mexer nos pesos do modelo em si ainda é caro demais e áspero demais.

Apresentador:

Você também falou de outra direção: se empurrarmos AutoResearch para fora, isso poderia virar uma superfície de colaboração mais aberta na internet. Como seria isso?

Andrej Karpathy:

Eu imagino um sistema onde gerar soluções candidatas é muito caro, mas verificar se uma solução candidata é válida é relativamente barato.

Por exemplo, em AutoResearch, alguém te dá um candidate commit dizendo que isso vai melhorar o treinamento do modelo. Verificar se realmente melhora pode ser algo relativamente bem definido; o difícil é encontrar esse commit primeiro.

No “sabor”, isso lembra Folding@home, SETI@home e até, em certa medida, blockchain. Só que aqui não são blocos, e sim commits; não é mineração, e sim busca experimental. O que é difícil é achar uma boa solução; verificar tende a ser mais barato.

Então, em teoria, você pode fazer uma colaboração entre um grupo de contribuidores não confiáveis na internet e um conjunto de nós confiáveis que validam. Se sandbox, isolamento de segurança e o pipeline de validação forem bem projetados, esse sistema poderia organizar a computação dispersa do mundo inteiro.

E isso é fascinante, porque até torna significativo “doar computação por interesse”. Se você se importa com câncer, você coloca computação numa trilha de AutoResearch para pesquisa de câncer; se você se importa com materiais, física ou outros problemas específicos, também pode direcionar computação para aquela área.

Apresentador:

Você também postou anteriormente um conjunto de dados de emprego. O que você queria ver ali?

Andrej Karpathy:

Eu estava tentando construir minha própria cadeia de pensamento: como AI vai agir no mercado de trabalho? Quais profissões só vão trocar de ferramenta, quais serão reestruturadas, e quais podem até crescer?

Se você entende o AI de hoje como um “trabalhador no mundo digital”, então o que ele faz melhor é manipular informação digital, não manipular diretamente o mundo dos átomos. A velocidade de copiar, modificar e transmitir bits é muito maior do que a de transformar o mundo físico.

Então minha intuição sempre foi: o espaço digital vai passar primeiro por uma reescrita em grande escala, ebulição e reestruturação; o mundo físico vai ser mais lento. Isso não significa que as profissões digitais necessariamente vão desaparecer, mas significa que a forma de trabalhar nelas será remodelada. Cargos que são principalmente em casa e principalmente lidam com informação digital serão especialmente impactados.

Apresentador:

Se alguém está procurando emprego, ou pensando “o que eu deveria aprender agora”, o que você diria?

Andrej Karpathy:

A primeira coisa é: não ignore isso, e não escolha evitá-lo por medo.

Essas ferramentas, por enquanto, são antes de tudo ferramentas de capacitação. A maioria dos trabalhos é, no fundo, uma sequência de tarefas; e uma parte dessas tarefas já pode claramente ser acelerada por esses sistemas. Então, nesta fase, acompanhar isso rapidamente e aprender a colaborar com isso é algo que praticamente qualquer trabalhador do conhecimento deveria fazer.

No longo prazo, eu não quero fingir que consigo prever com precisão, mas no curto prazo parece uma alavanca enorme.

Em software engineering, eu sou relativamente otimista. A demanda por software é quase infinita; historicamente o limitador não foi falta de demanda, e sim ser caro demais, lento demais e difícil demais. Uma vez que a barreira cai, o Paradoxo de Jevons provavelmente aparece: quando fica mais barato, a demanda total aumenta.

Como ATMs não fizeram os caixas de banco simplesmente desaparecerem; como as agências ficaram mais baratas, os bancos puderam abrir mais, e a demanda total foi ampliada. AI pode ter efeito semelhante em software: software ficará mais barato, mais poderoso, mais efêmero, mais fácil de customizar — e a demanda total da sociedade por software continuará subindo.

Apresentador:

Muita gente pergunta: se você enxerga assim, então o melhor lugar para estar ainda seria um laboratório de fronteira?

Andrej Karpathy:

Eu não acho que a resposta seja tão simples.

Laboratórios de fronteira são muito importantes, claro, mas fazer coisas fora do laboratório, no nível do ecossistema, também pode ter enorme impacto. O problema é: uma vez que você entra numa organização, você deixa de ser um agente completamente livre. Você sofre muitas pressões explícitas e implícitas — algumas coisas você pode dizer, outras não; alguns temas você pode tocar, outros não.

Fora do laboratório, você pode ter mais oportunidade de influenciar o ecossistema: escrever ferramentas, moldar workflows, impulsionar infraestrutura aberta, fazer educação, criar novos paradigmas de colaboração, ser um participante realmente independente.

Então eu não equiparo “a posição mais valiosa” de forma simples a “entrar numa única empresa de ponta”.

Apresentador:

E como você vê o longo prazo entre open source e closed source?

Andrej Karpathy:

Instintivamente, eu ainda prefiro open source.

Por um lado, a centralização extrema de inteligência fechada tem risco estrutural. Olhando a história, tanto na política quanto na economia, a concentração excessiva de poder raramente tem um bom histórico.

Por outro lado, na história do software, Windows e macOS são fortes, claro, mas sistemas abertos como Linux acabaram sustentando enorme parte da computação do mundo real. AI pode muito bem ter um padrão parecido: a capacidade de fronteira talvez fique por algum tempo nas mãos de poucos sistemas fechados, mas eu espero que no futuro existam alternativas suficientemente fortes, suficientemente abertas, que possam ser mais amplamente compreendidas e moldadas pela sociedade.

Eu não acho que “concentrar os sistemas inteligentes mais importantes nas mãos do menor número possível de pessoas” seja um fim saudável.

Apresentador:

Você também mencionou um ponto bem interessante: a interface entre o mundo digital e o mundo físico pode ser algo especialmente valioso de observar a seguir.

Andrej Karpathy:

Sim. Porque bits são fáceis demais de copiar e manipular, então as mudanças no espaço digital explodem primeiro; mas se agentes começam a conversar entre si, executar tarefas e formar uma agent economy, no fim eles inevitavelmente encostam no mundo real.

Você inevitavelmente precisa tocar sensores, tocar dispositivos, iniciar experimentos, chamar sistemas externos, coletar dados novos. Essa interface é muito interessante, porque não precisa começar por “robôs caros”. Muitas capacidades de entrada no mundo físico já existem como câmeras, sensores, hardware pronto e interfaces de software. Se o agente for inteligente o bastante, ele consegue usar essas coisas para obter dados, controlar sistemas e concluir tarefas.

Então eu acho que a chamada agentic web provavelmente vai existir: a internet deixará de ser apenas sites para humanos navegarem e virará uma superfície de trabalho onde agentes consomem, geram, verificam e trocam informações entre si.

Apresentador:

Isso também implica que a própria coleta de dados e o processo de treinamento serão cada vez mais reestruturados.

Andrej Karpathy:

Sim. Muitos processos de treinamento, coleta e avaliação ficarão mais mecânicos e mais programáticos. Certas tarefas são especialmente adequadas para métricas limpas e ciclos fechados automatizados — o treinamento de LLM em si é um exemplo típico.

Então você vai ver cada vez mais sistemas se reorganizando para “alimentar agentes” e “alimentar o processo de treinamento”. Parte do trabalho na sociedade, no fim, pode até se deslocar para servir às necessidades do próprio sistema de máquinas.

Apresentador:

Por fim, quero falar de educação. Você fez o MicroGPT. Em uma era como esta, em que “ensinar” vai se transformar?

Andrej Karpathy:

O MicroGPT sempre foi um playground de ensino pequeno, com o objetivo de fazer as pessoas enxergarem claramente o que está acontecendo no treinamento de LLM. Se você não busca rodar rápido, e sim ser claro, ele é basicamente um trecho curto de Python muito legível: dataset de texto, uma rede neural pequena, forward pass, backward pass, um autograd minimalista, mais um otimizador. Ele comprime o processo inteiro numa escala que uma pessoa comum ainda consegue realmente ler e entender.

Mas eu tenho sentido cada vez mais que a educação em si também vai mudar. Antes, educação era cursos, palestras, documentação; no futuro, vai parecer cada vez mais “eu escrevo o melhor caminho de explicação que conheço como habilidades e prompts que um agente consegue executar”.

Ou seja, eu não necessariamente vou dar aula diretamente para cada pessoa; eu vou codificar “como explicar algo”. Assim, quando o aprendiz não entende um ponto, o agente pode explicar de três formas, guiá-lo pelo codebase e ajustar a ordem de acordo com o background dele.

O que realmente importa passa a ser: você consegue injetar com precisão suas percepções, seu julgamento e sua estrutura de explicação no agente? O que o agente não consegue fazer é o seu trabalho de verdade; o que o agente já consegue fazer bem, ele em breve só fará melhor do que você.

Apresentador:

Então sua contribuição real vai ficar cada vez mais parecida com: decidir o que vale a pena explicar e como explicar.

Andrej Karpathy:

Sim. Muitas coisas o agente já entende; só que ele talvez ainda não consiga inventar sozinho o melhor jeito de explicar. Essa parte, por enquanto, ainda é onde está o valor humano. Mas essa fronteira também está se movendo o tempo todo.

Então você precisa decidir de forma muito estratégica: em quais coisas, afinal, vale a pena gastar seu tempo.

Apresentador:

Muito obrigado, Andrej.

Andrej Karpathy:

Obrigado pelo convite.


Se você quiser ver o vídeo original em inglês:

1 Curtiu