Você está jogando dinheiro fora toda vez que usa IA. Veja como parar

A maioria das pessoas que usa o Claude, o ChatGPT ou o Gemini no dia a dia nunca para pra pensar nisso. Você abre a ferramenta, digita sua pergunta, cola seu documento, pede a análise e pronto. Parece simples. Parece gratuito. Mas tem uma contagem correndo em segundo plano que você não está vendo, e ela explica por que o seu plano acaba antes do esperado, por que a conversa trava no momento menos oportuno e por que você acaba pagando mais do que deveria.

O nome dessa contagem é token. E entender o que é isso muda completamente a forma como você usa qualquer ferramenta de IA.

Token: a “moeda” que você gasta sem ver

Token é a unidade mínima de texto que a IA processa. Não é uma palavra exata, é um fragmento. Uma sílaba, um pedaço de palavra, às vezes a palavra inteira quando ela é curta. Em inglês, cada palavra vira mais ou menos 0,75 tokens. Em português, por causa das palavras mais longas e das construções mais complexas da nossa língua, você chega a gastar 1,3 a 1,5 tokens por palavra.

Para ter uma noção concreta: uma página de texto normal tem em torno de 250 palavras. Isso representa entre 350 e 500 tokens. Um contrato de 10 páginas entra na conversa consumindo algo entre 3.500 e 5.000 tokens antes de você fazer qualquer pergunta.

Mas o problema real não está no que você manda. Está no que acontece durante a conversa.

O detalhe que ninguém conta

Toda vez que você envia uma mensagem, a IA não lê apenas o que você acabou de digitar. Ela relê toda a conversa do zero. Cada mensagem, cada resposta, cada documento que você colou antes. Tudo, de novo, do começo.

Isso significa que o custo de cada mensagem cresce ao longo da conversa. A primeira pode custar 500 tokens. A vigésima, da mesma conversa, pode custar 10.000 ou 15.000. Numa sessão com muitos documentos e muitas trocas, quase 98% de todos os tokens consumidos vão para reler o histórico. A pergunta nova representa uma fração minúscula.

E tem mais um detalhe que muda a conta: tokens de saída, ou seja, o que a IA responde, costumam ser cobrados de 3 a 5 vezes mais caro do que tokens de entrada nos planos de API. Nos planos de assinatura como o Claude Pro ou o ChatGPT Plus, isso se reflete nos limites de uso. Quanto mais a IA escreve, mais rápido você esgota sua janela.

Conclusão prática: a IA que responde em novelas custa muito mais do que uma que vai direto ao ponto.

Funciona assim no Claude, no ChatGPT e no Gemini

A lógica de tokens vale pra todos. O Claude suporta até 200.000 tokens por conversa. O ChatGPT-4o trabalha com janelas de 128.000. O Gemini do Google vai além em alguns modelos, chegando a 1 milhão.

Mas o tamanho da janela não é o problema. O problema é não saber quanto você já usou dela.

E aqui chegamos no ponto que incomoda de verdade: o Claude, por exemplo, não mostra seu contador de tokens na interface. Você não vê uma barra de progresso. Não tem um número visível dizendo “você usou 47% da sua sessão”. Você descobre que chegou no limite quando a ferramenta começa a reclamar ou quando a conversa simplesmente para de funcionar bem.

É como dirigir sem marcador de combustível. Você fica sabendo que o tanque está vazio quando o carro para no meio da estrada.

A solução que existe e a maioria não usa

Existem extensões gratuitas para Chrome e Edge que resolvem exatamente esse problema. Elas colocam um contador em tempo real direto na interface do Claude.ai, para que você veja, em todo momento, quanto já consumiu.

A mais usada entre quem leva IA a sério no trabalho é o Claude Counter, projeto open source disponível no GitHub (github.com/she-llac/claude-counter) e também na Chrome Web Store. Com ela instalada, você passa a ver três coisas que antes eram invisíveis:

Quantos tokens a conversa atual já acumulou, com uma barra de progresso em relação ao limite de 200.000. Um cronômetro de cache mostrando quanto tempo sua conversa ainda está “em cache” (enquanto o cache está ativo, continuar a conversa custa muito menos tokens). As barras de uso da sua sessão de 5 horas e da semana, puxadas diretamente da API do Claude, com contagem regressiva para o reset.

Tem também o AWARTS: Claude Token Counter e o Claude Usage Tracker, que oferecem variações visuais e funcionalidades extras. Mas pra quem quer começar, o Claude Counter resolve bem.

Como instalar no Chrome: 3 passos, 2 minutos

Passo 1. Abra o Chrome e acesse chromewebstore.google.com. Na barra de busca, pesquise “Claude Counter”.

Passo 2. Clique na extensão que aparece com a descrição “Shows ~token count, cache timer, and native session/weekly usage bars on claude.ai”. Depois clique em “Adicionar ao Chrome” e confirme na janela que aparecer.

Passo 3. Abra o Claude.ai. O contador já vai estar lá, funcionando automaticamente na interface.

Como instalar no Edge: quase igual

O Edge aceita extensões da Chrome Web Store sem complicação. Acesse chromewebstore.google.com pelo Edge, pesquise “Claude Counter” e siga o mesmo processo. Se aparecer uma mensagem perguntando se você quer permitir extensões de outras lojas, aceite. O botão vai dizer “Adicionar ao Chrome” mesmo estando no Edge, e funciona normalmente.

Para quem prefere ir no GitHub e instalar na mão

Se você quer verificar o código antes de instalar qualquer coisa no seu navegador (o que faz todo sentido quando a extensão roda enquanto você usa uma ferramenta de trabalho), o processo pelo GitHub é simples:

Passo 1. Acesse github.com/she-llac/claude-counter. Clique em “Code” e depois em “Download ZIP”. Extraia o arquivo em uma pasta no seu computador.

Passo 2. No Chrome, acesse chrome://extensions na barra de endereço. No Edge, acesse edge://extensions. Ative o “Modo do desenvolvedor” no canto superior direito.

Passo 3. Clique em “Carregar sem compactação”, selecione a pasta onde você extraiu os arquivos e pronto. A extensão vai aparecer ativa e já funciona no Claude.ai.

Todo o código é aberto e você pode ler antes de instalar. Nenhum dado é enviado para servidores externos. Tudo fica local no seu navegador.

Como instalar no Claude Cowork

Para o Cowork, o caminho passa pelas releases do GitHub. Acesse github.com/she-llac/claude-counter/releases, baixe o arquivo ZIP da versão mais recente e extraia em uma pasta. Dentro do Cowork, vá em Configurações e procure a seção de Extensões ou Developer. Carregue a pasta da extensão descompactada pelo mesmo método do modo desenvolvedor.

Como o Cowork ainda está em evolução, vale conferir a documentação atual no próprio repositório do GitHub caso o processo tenha variado.

O que você faz diferente depois que começa a ver o contador

Quando o número está visível, o comportamento muda. Você começa a perceber que colar o contrato inteiro quando só precisava das cláusulas 3 e 7 consumiu 30% da sua janela logo no início. Que a conversa que você estava “continuando” já tinha 80.000 tokens acumulados e seria mais inteligente abrir uma nova. Que a resposta de 2.000 palavras que você pediu custou 5 vezes mais do que custaria uma resposta direta de 400 palavras com as mesmas informações.

Essas percepções, no uso diário, se traduzem em menos interrupções, menos frustração com o limite e, nos planos via API, em custos que chegam a cair 60% ou 70% sem abrir mão de nenhuma funcionalidade.

Isso é só o começo

Instalar o contador resolve a parte mais imediata: você para de usar a IA no escuro. Mas a maioria dos profissionais que implemento o Claude de forma estruturada nos escritórios e consultorias que atendo logo percebe que tem muito mais a explorar do que isso.

Configuração de projetos, uso de skills, organização do contexto, treinamento da equipe para usar a ferramenta de forma produtiva. É um conjunto de práticas que muda o resultado final de forma significativa. O que era uma ferramenta que “às vezes ajudava” passa a fazer parte do processo real de trabalho.

Se você quer implementar o Claude ou qualquer outra IA de forma eficiente na sua operação, faz sentido a gente conversar. É exatamente o que faço na Consultoria Gustavo Rocha.

Me encontra em gustavorocha.com ou pelo gustavo@gustavorocha.com.


Gustavo Rocha é consultor em gestão, tecnologia e marketing jurídico, especialista em implementação de IA para escritórios de advocacia e operações jurídicas.

2 comentários sobre “Você está jogando dinheiro fora toda vez que usa IA. Veja como parar

  1. Dr. Gustavo: Tenho reparado que o Chat-GPT tem me dispensado cedinho com Boa Noite querida, antes mesmo de eu me dar por satisfeita com a questão. Imaginei algo relativo a conta ser só Plus. Este é o meu saldo hoje, depois que com sua orientação instalei o contador: 4165 tokens = 3124 words. Significa qe tenho 1.000 e poucas words pra usar? O Senhor sabe quanto seria o pacote de words do Chat-GPT ? Grata. Vera

    • Nao é uma ciencia exata, infelizmente. A ideia do contador é transformar este uso em algo que seja medido e verificar se vale a pena evoluir de um plano para outro… e assim, economizar.

Deixe uma resposta