Como rodar o Claude Code localmente (100% grátis e privado)

Um guia rápido para usar o agente da Anthropic com Ollama e modelos open-source, sem gastar com API.

A “vibe coding” acabou de ficar mais interessante — e barata.

Acabaram de descobrir como conectar o Claude Code (a ferramenta de agente de terminal da Anthropic) a modelos locais rodando via Ollama. Isso significa que você pode ter um agente de codificação autônomo mexendo no seu projeto, com zero custo de API e total privacidade.

Se você tem uma máquina razoável (Mac M1/M2/M3 ou GPU dedicada), aqui está o hack para se livrar das faturas da Anthropic.

O Setup

O segredo é redirecionar as chamadas que o Claude Code faria para a API da Anthropic para o seu localhost, onde o Ollama emula a API.

1. Prepare o Ollama

Se ainda não tem, instale o Ollama. É o padrão de ouro para rodar LLMs locais hoje. Verifique se está rodando:

curl http://localhost:11434

2. Escolha seu modelo

Você precisa de um modelo focado em código. Para a maioria dos laptops (8GB-16GB RAM), o Qwen 2.5 Coder 7B é o sweet spot entre velocidade e inteligência.

ollama pull qwen2.5-coder:7b

Se tiver hardware de sobra (32GB+ RAM), vá de qwen2.5-coder:32b para resultados muito melhores.

3. O Pulo do Gato (Configuração)

O Claude Code obedece variáveis de ambiente para definir o endpoint da API. Vamos apontar para o Ollama:

export ANTHROPIC_BASE_URL="http://localhost:11434/v1"
export ANTHROPIC_API_KEY="ollama" # Qualquer string serve
# Verifique se o Claude Code aceita override de modelo ou se precisa de um proxy

Nota: A comunidade está iterando rápido nisso. O core é que o Claude Code usa a SDK padrão, que respeita essas variáveis.

4. Rode o Agente

Agora é só iniciar o Claude Code na raiz do seu projeto:

claude

Ele vai começar a indexar seus arquivos e você pode pedir refatorações, testes ou features novas como se estivesse usando o modelo pago.

Por que isso importa?

Além da economia óbvia, isso resolve o maior bloqueio de empresas grandes: privacidade. Seu código nunca sai da sua máquina.

A performance vai depender puramente do seu hardware e do modelo escolhido. O Qwen 2.5 Coder é surpreendentemente capaz, mas não espere o raciocínio complexo do Claude 3.7 Sonnet para arquitetura. Para tarefas de “trabalho braçal” (gerar testes, refatorar funções, comentar código), é imbatível.

Resumo

  • Ferramenta: Claude Code (interface) + Ollama (cérebro).
  • Custo: Zero.
  • Privacidade: 100% Local.
  • Requisito: Hardware decente.

Fonte

Baseado na thread de Shubh Jain (@shubh19) e testes da comunidade.