Eu até hoje não usei Claude Code, Codex ou Gemini, então pode ser bastante off topic o que vou falar, e falando so no contexto de programação (num home server bem humilde que tenho uso o Hermes Agent, mas pra outras coisas, e to bem no começo ainda, não teria nada útil pra falar a respeito): comecei a usar agentes esse ano apenas, e usava diferentes modelos via OpenRouter mas essa semana migrei pra usar modelos abertos no Ollama por que achei que poderia ser interessante por conta do custo (estava gastando coisa de 50 dólares por mês em créditos no OpenRouter, e a assinatura do Ollama mais barata é 20, dai resolvi fazer o teste). No começo me impressionei bastante, realmente tive uma sensação de que acelerou muito o meu trabalho, ajudando a realizar implementações e resolver bugs numa fração do tempo, mas acredito que isso também vai variar com o modelo de trabalho individual e o quão interessado e capaz é cada um de avaliar o resultado, pois é muito fácil largar "na mão" do agente/modelo e so confiar plenamente neles. Particularmente eu uso a IA pra fazer uma espécie de pair-programming, bem no espirito do extreme programming mesmo, e estou começando devagar a, por meio de skills, deixar o meu processo mais diligente e previsível (e, acredito, mais econômico), forçando ou sugerindo fortemente o uso das metodologias que considero benéficas e que eu por ventura possa me passar (TDD, YAGN, idempotência, invariância, etc...), seja com coisas escritas por mim, seja com ferramentas pré-existentes (e que eu possa personalizar). Eu reviso absolutamente tudo (afinal alucinações são reais), e gosto inclusive de ler o processo de "thinking", tratando-a como um colega menos experiente porém muito confiante (e que frequentemente me ensina coisas que não sabia, relembra coisas que eu esqueci, e em relação ao código em si, com as restrições e regras impostas, na maioria das vezes vai fazer melhor do que eu faria), e dando o caminho para o que eu quero, isso parece tornar a coisa mais lenta, mas me da dois benefícios que acho que valem, e muito: torna o processo mais lento, e assim gasto menos tokens e no fim das contas isso me custa menos, enquanto ainda estou com o controle da situação; me permite vislumbrar um futuro relativamente próximo no qual seja possível realizar isso com hardware próprio e modelos locais (pois a alta dos preços é real, bastante previsível inclusive, e isso pode tornar a coisa complicada casa eu me torne dependente disso).
Dito isso, tem gente em quem confio e com quem bati muito papo a respeito, e minha conclusão de momento é que, pra variar, não existe bala de prata... vai muito das restrições pessoais/empresarias e do modelo de trabalho adotado, seja por preferência, seja por imposição. Eu mesmo por aqui tenho usado o agente Pi (minimalista, vem puro puro, "de fábrica" nem suporte a MCP tem, e vou adicionando o que acho interessante, do meu modo, acabando por criar o "meu" agente) com modelos via OpenRouter (até semana passada) e Ollama Cloud, e até hoje testei GLM-5, GLM-5.1, MiniMax 2.5M (hoje free no OpenRouter), Qwen 3.6-Plus (no período em que esteve free, em testes), MiniMax 2.7M e Kimi K2.6, com diferentes níveis de sucesso (e custo), mas todos atendendo ao meu processo em particular bem o suficiente pra mim, só que eu gosto de pesquisar esse tipo de coisa, gosto de "escovar bit" e otimizar processos, mas consigo ver facilmente um colega que prefere pegar o pacote pronto e vai no Claude Code, Codex ou pega um Antigravity ou Cursor e tem nível de sucesso semelhante (aparentemente, por que né, so sei dos relatos, e eu mesmo não saberia avaliar isso com tanta precisão assim, então se falou tá falado hahaha).