Como rodar o Claude Code localmente (100% grátis e privado)
Um guia rápido para usar o agente da Anthropic com Ollama e modelos open-source, sem gastar com API.
A “vibe coding” acabou de ficar mais interessante — e barata.
Acabaram de descobrir como conectar o Claude Code (a ferramenta de agente de terminal da Anthropic) a modelos locais rodando via Ollama. Isso significa que você pode ter um agente de codificação autônomo mexendo no seu projeto, com zero custo de API e total privacidade.
Se você tem uma máquina razoável (Mac M1/M2/M3 ou GPU dedicada), aqui está o hack para se livrar das faturas da Anthropic.
O Setup
O segredo é redirecionar as chamadas que o Claude Code faria para a API da Anthropic para o seu localhost, onde o Ollama emula a API.
1. Prepare o Ollama
Se ainda não tem, instale o Ollama. É o padrão de ouro para rodar LLMs locais hoje. Verifique se está rodando:
curl http://localhost:11434
2. Escolha seu modelo
Você precisa de um modelo focado em código. Para a maioria dos laptops (8GB-16GB RAM), o Qwen 2.5 Coder 7B é o sweet spot entre velocidade e inteligência.
ollama pull qwen2.5-coder:7b
Se tiver hardware de sobra (32GB+ RAM), vá de qwen2.5-coder:32b para resultados muito melhores.
3. O Pulo do Gato (Configuração)
O Claude Code obedece variáveis de ambiente para definir o endpoint da API. Vamos apontar para o Ollama:
export ANTHROPIC_BASE_URL="http://localhost:11434/v1"
export ANTHROPIC_API_KEY="ollama" # Qualquer string serve
# Verifique se o Claude Code aceita override de modelo ou se precisa de um proxy
Nota: A comunidade está iterando rápido nisso. O core é que o Claude Code usa a SDK padrão, que respeita essas variáveis.
4. Rode o Agente
Agora é só iniciar o Claude Code na raiz do seu projeto:
claude
Ele vai começar a indexar seus arquivos e você pode pedir refatorações, testes ou features novas como se estivesse usando o modelo pago.
Por que isso importa?
Além da economia óbvia, isso resolve o maior bloqueio de empresas grandes: privacidade. Seu código nunca sai da sua máquina.
A performance vai depender puramente do seu hardware e do modelo escolhido. O Qwen 2.5 Coder é surpreendentemente capaz, mas não espere o raciocínio complexo do Claude 3.7 Sonnet para arquitetura. Para tarefas de “trabalho braçal” (gerar testes, refatorar funções, comentar código), é imbatível.
Resumo
- Ferramenta: Claude Code (interface) + Ollama (cérebro).
- Custo: Zero.
- Privacidade: 100% Local.
- Requisito: Hardware decente.
Fonte
Baseado na thread de Shubh Jain (@shubh19) e testes da comunidade.