A Anthropic lançou o Claude Opus 4.8 ontem com duas atualizações que impactam diretamente o trabalho do time financeiro.
Controle de esforço. Pela primeira vez, você escolhe quanto o modelo pensa antes de responder. Não é mais caixa preta. Você decide a velocidade e a profundidade antes de mandar o prompt, dependendo do que a decisão exige.
A segunda atualização (Dynamic Workflows, subagentes em paralelo no Claude Code, disponível nos planos Enterprise, Team e Max) é técnica, voltada pra quem desenvolve. Não é o foco aqui.
Esse artigo é sobre a primeira: como usamos o controle de esforço numa simulação de fechamento mensal, rodando os três níveis no mesmo pacote de dados.
A metáfora certa
Pense num consultor sênior que pode trabalhar em velocidades diferentes.
No esforço baixo, ele faz leitura rápida. Sinaliza o urgente, aponta onde olhar, entrega em 30 segundos. Não aprofunda. É suficiente pra orientar sua próxima hora.
No esforço alto, ele diagnostica. Separa fato de inferência, monta pontes de variância, gera as perguntas certas pra reunião.
No esforço máximo, ele prepara a apresentação. Revisa as evidências, elege as 3 questões que a diretoria precisa discutir, escreve a narrativa e lista tudo que não devemos afirmar porque os dados ainda não suportam.
Você escolhe o nível antes de enviar o prompt. É isso.
A interface tem 5 opções (Low, Medium, High, Extra, Max). O teste aqui usou os três extremos: Baixo, Alto e Máximo.
O cenário que testamos
Pegamos um fechamento fictício de uma distribuidora B2B brasileira (a Vértice Distribuidora) e rodamos os três níveis com o mesmo pacote:

Mesmo arquivo. Três níveis. Resultados completamente diferentes.
Nível 1: leitura de 12 segundos
Quando usar: chegou o pacote, você tem 5 minutos antes de uma call. Quer orientação rápida, não análise.
Configuração no claude.ai: clique no seletor de esforço e escolha "Baixo"
O prompt:
O que entregou:
Cinco pontos limpos. O sinal positivo foi a receita +4,8% vs. orçado. O sinal negativo foi o EBITDA -19,8% apesar do crescimento. "O crescimento foi real, mas não foi rentável." As três áreas apontadas: variância de margem bruta, deterioração do ciclo de caixa, qualidade dos recebíveis.
Tempo de resposta: 12 segundos. Não precisamos abrir nenhuma aba do Excel.
Nível 2: diagnóstico de variância
Quando usar: você já tem a leitura inicial. Agora quer entender os drivers antes de escrever qualquer narrativa.
Configuração no claude.ai: clique no seletor de esforço e escolha "Alto"
O prompt:
O que entregou:
Fatos separados de inferências logo no item 1. A interpretação apontou que o crescimento de Bebidas (+7,3%) com margem abaixo da média da empresa era o driver principal da compressão. Não foi problema de custo, foi problema de mix. A bridge de caixa fechou: consumo de R$ 290 k explicado em três movimentos (PMR subiu, PME subiu por HPC antecipado, PMPC caiu). As 7 perguntas foram cirúrgicas. Nenhuma óbvia.
Aliás, foi no nível 2 que ficou claro pra mim o que esse controle de esforço muda de verdade: você para de receber análise genérica e passa a receber diagnóstico específico. São coisas bem diferentes.
Nível 3: narrativa para a diretoria
Quando usar: análise feita. Hora de escrever o que vai para a reunião.
Configuração no claude.ai: clique no seletor de esforço e escolha "Máximo"
O prompt:
O que entregou:
A tabela de evidências marcou "nível de confiança médio" nos dados que vinham da nota do CEO (informação de segunda mão) e "alto" apenas nos dados diretos do DRE. Faz sentido, e é exatamente o tipo de distinção que a gente raramente escreve explicitamente.
A seção "O que não devemos afirmar ainda" identificou seis overclaims concretos. Incluindo "a compra antecipada de HPC protegeu a margem do câmbio" (parcialmente verdade, mas o resultado financeiro ainda piorou R$ 10 k) e "a empresa tem conforto de liquidez" (o saldo existe, mas a tendência de consumo de R$ 290 k/mês merece qualificação).
Essa parte nos interessa mais do que a narrativa em si. Não o que escrever, o que não devemos escrever.
Roteador, não botão de qualidade
Esforço máximo pra cada leitura rápida é desperdício de tempo e de token. Esforço baixo pra uma apresentação de sócios é negligência.
A pergunta antes de mandar qualquer prompt: qual velocidade serve esta decisão?
Agora para entender como isso impacta no seu dia a dia
Escolha o cargo que melhor descreve sua posição no time financeiro.
Se você é CFO

Se você é Gestor ou Head de FP&A / Controladoria

Se você é Analista, Coordenador ou Especialista

O que não devemos afirmar ainda
Antes de publicar, é justo ser honesto sobre os limites:
- O tempo de resposta depende do tamanho do arquivo e da carga do servidor. "15 segundos" é referência, não garantia.
- O Claude não acessa sistemas internos, você precisa exportar o pacote manualmente.
- A qualidade do output depende da qualidade do input. DRE mal estruturado gera análise mal estruturada.
- O esforço máximo usa mais tokens e pode consumir limite de uso mais rápido em planos básicos.
Barte Squads de IA para times financeiros
O que você leu aqui é o tipo de coisa que os Squads de times finceiros da Barte aplica toda semana. Nós entendemos seu problema e criamos soluções customizadas para o seu negócio.
Especialistas financeiros e engenheiros de IA alocados no seu time, do fechamento à conciliação, sem software novo pra operar e sem meses de implementação. Empresas que entraram saíram de 10 dias de fechamento para 24 horas. Se fizer sentido clica aqui que vamos te explicar tudo..
** Vértice Distribuidora é uma empresa fictícia criada para este teste. Os dados financeiros são simulados.


.png)

.png)
.png)