Na sexta-feira, o criador do Claude Code, Boris Cherny, fez uma aparição na conferência @Scale da Meta e, surpreendentemente, a primeira pergunta do público foi sobre loops.
“Os loops são o próximo ciclo de hype”, perguntou o questionador, “ou são reais?”
A resposta de Cherny foi enfática: “sim, são de verdade”, disse ele.
“Há dois anos, escrevíamos o código-fonte manualmente. Começamos a fazer a transição para que os agentes escrevessem o código. E agora estamos fazendo a transição para o ponto em que os agentes alertam os agentes para que eles escrevam o código”, continuou ele. “Por maior que tenha sido o passo do código-fonte até os agentes, os loops são igualmente importantes e um passo tão grande.”
Mais tarde na palestra (por volta das 32h no vídeo do YouTube postado acima), Cherny foi específico sobre os loops que ele continua executando em seu próprio trabalho. Um agente procura continuamente maneiras de melhorar a arquitetura do código, enquanto outro procura abstrações duplicadas que possam ser unificadas. Eles enviam solicitações pull como qualquer outro codificador e, como o código muda constantemente, eles nunca param de ser executados.
É uma ideia poderosa, especialmente com uma figura tão significativa como Cherny por trás dela. Com a mudança para a IA de agência, o foco da maioria dos usuários tem sido gerenciar seus agentes da melhor forma possível: estabelecer metas claras, verificar unidades discretas de progresso e não permitir que eles se desviem muito além do prompt. O loop dá um passo adiante ao autorizar um enxame de agentes a trabalhar continuamente em segundo plano, indefinidamente. É muita confiança depositada na IA – mas com os modelos melhorando rapidamente, pode ser o próximo passo para fazer com que a IA lide com o trabalho real.
A primeira coisa a reconhecer é que isso não é inteiramente novo. Loops recursivos – funções que se autodenominam para repetir uma ação, junto com uma condição que interrompe o loop – são um dos pilares dos cursos de introdução à ciência da computação. Esses loops seguem uma lógica não determinística — ou seja, é um subagente que escolhe quando parar o loop em vez de uma condição clara — mas a mesma abordagem básica está em ação. Assim que os programadores começaram a usar a IA para concluir tarefas, alguma versão do loop recursivo, com a IA supervisionando a IA, certamente surgiria.
Ao contrário da computação clássica, os loops de agente podem ser irritantemente simples. Um dos truques mais populares é o circuito Ralph (nomeado em homenagem a Ralph Wiggum), que basicamente resume todo o trabalho que a modelo realizou e pergunta se ela atingiu seu objetivo. É uma maneira de lidar com os modelos de IA que se perdem à medida que são executados por muito tempo – essencialmente balançando o modelo para frente e para trás até que a tarefa seja concluída.
Outra maneira de pensar em loops é como parte da pressão geral por mais computação em tempo de teste. Como observou o pesquisador da OpenAI, Noam Brown no início deste mêsmodelos contemporâneos podem resolver quase qualquer problema se você aplicar computação suficiente a eles. Isso significa que uma maneira de garantir que um problema seja resolvido é continuar aplicando computação até que seja concluído. Isso é particularmente verdadeiro para problemas de escalada, como melhorar uma base de código, onde o modelo pode continuar fazendo melhorias incrementais até atingir um determinado limite. Ou, como no exemplo de Cherny, pode simplesmente continuar fazendo melhorias incrementais enquanto houver computação para gastar nisso.
Se isso parece caro, deveria. Assim como a IA de agente antes dela, os loops de IA queimam tokens muito mais rápido do que simples chatbots de perguntas e respostas – e como o objetivo é manter o loop funcionando o tempo todo, não há limite para quanto você pode gastar. Isso é bom para a Anthropic, que em última análise está no negócio de venda de tokens, mas para todos os outros, pode ser uma forma cara de trabalhar.
Ainda assim, dependendo do problema que o loop de agência está tentando resolver e da configuração correta que permite a supervisão de gastos de tokens, desvios e outros problemas clássicos de IA, os benefícios podem ser surpreendentes o suficiente para compensar os custos.
Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.