Monitorando o uso de token com o painel de auditoria em tempo real¶

Visão geral¶

O painel Auditoria de token em tempo real oferece total transparência no consumo de “combustível” de IA. Monitore exatamente quantos tokens estão sendo consumidos, por quais recursos e por quais modelos — com proteção de limite rígido para garantir que não haja faturas surpresas.

Neste tutorial, você aprenderá:

Como navegar no painel Token Audit
Como ler relatórios de consumo de tokens
Como definir e gerenciar a proteção de limite rígido
Como otimizar o uso de tokens em seus projetos
Como interpretar as análises baseadas no LiteLLM

O painel de auditoria de token¶

┌──────────────────────────────────────────────────────────────┐
│  Token Audit Dashboard — Project: My SaaS App               │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  Monthly Budget: $150.00        Used: $87.50 (58%)          │
│  ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  │
│                                                              │
│  ┌─────────────┐ ┌─────────────┐ ┌─────────────┐           │
│  │ Tasks Today │ │ Avg Tokens  │ │ Cost/Task   │           │
│  │     12      │ │   8,450     │ │   $7.29     │           │
│  └─────────────┘ └─────────────┘ └─────────────┘           │
│                                                              │
│  Model Breakdown:                                            │
│  Claude 4.5   ████████████  42%  ($36.75)                   │
│  GPT-5        ████████████████████  38%  ($33.25)           │
│  Gemini 3 Pro ██████  14%  ($12.25)                         │
│  DeepSeek     ██  6%  ($5.25)                               │
│                                                              │
│  Recent Tasks:                                               │
│  ✅ Create auth endpoint     12,300 tokens  $9.84            │
│  ✅ Fix pagination bug        4,200 tokens  $3.36            │
│  🔄 Build dashboard UI       18,500 tokens  $14.80 (in prog) │
│  ⏳ Write unit tests          6,800 tokens  $5.44 (queued)   │
│                                                              │
│  [Set Hard Limit] [Export Report] [View Details]             │
└──────────────────────────────────────────────────────────────┘

Etapa 1: navegue no painel¶

Seção Visão Geral¶

Métrica	Descrição
Orçamento Mensal	Seu limite de gastos com token configurado
Usado	Consumo atual e percentagem
Restante	Orçamento restante para o ciclo de faturamento
Dias restantes	Dias restantes no ciclo atual

Cartões de resumo¶

Cartão	Descrição
Tarefas hoje	Número de tarefas de IA enviadas hoje
Média de tokens/tarefa	Consumo médio de tokens por tarefa
Custo/Tarefa	Custo médio por tarefa de IA

Análise do modelo¶

Mostra o consumo de tokens por modelo:

Gráfico de barras visual: uso proporcional por modelo
Porcentagem: Participação no consumo total
Valor em dólares: Custo atribuído a cada modelo

Tarefas Recentes¶

Lista suas tarefas de IA mais recentes com:

Status: Concluído (✅), Em andamento (🔄), Na fila (⏳), Com falha (❌)
Contagem de tokens: Total de tokens consumidos
Custo: valor em dólares gasto

Etapa 2: Definir proteção de limite máximo¶

Configurar limites rígidos¶

Clique em “Definir limite rígido”
Escolha seu tipo de limite:
Limite mensal: gasto máximo por ciclo de faturamento
Limite diário: gasto máximo por dia
Limite por tarefa: gasto máximo por tarefa individual
Defina o valor (por exemplo, US$ 150/mês)
Escolha a ação quando o limite for atingido:
Pausa: Interrompa todas as tarefas de IA até retomar manualmente
Alerta: Envie notificação, mas continue processando
Clique em “Salvar”

Limitar notificações¶

Você receberá notificações quando:

Limite	Notificação
50% utilizado	Informativo: “Você usou 50% do seu orçamento mensal”
75% utilizado	Aviso: “Você usou 75% – considere revisar as prioridades das tarefas”
90% usado	Alerta: “Você usou 90% — aproximando-se do seu limite máximo”
100% alcançado	Ação: Tarefas pausadas (se estiver no modo Pausa) ou alerta final (se estiver no modo Alerta)

Etapa 3: Leia relatórios detalhados¶

Relatório em nível de tarefa¶

Clique em qualquer tarefa para ver o uso detalhado do token:

Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes

Token Breakdown:
├── Claude 4.5:    2,400 tokens  (Architecture design)
├── GPT-5:         8,200 tokens  (Code implementation)
├── Gemini 3 Pro:  1,800 tokens  (Architecture review)
├── DeepSeek:        900 tokens  (Code refactoring)
└── Total:        13,300 tokens  ($10.64)

Quality Gate:
├── Static Analysis:  PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests:       PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)

Relatório em nível de projeto¶

Vá para Analytics → Relatório do Projeto
Selecione o período
Visualizar:
Total de tokens consumidos em todas as tarefas
Detalhamento de custos por modelo, tipo de tarefa e membro da equipe
Análise de tendências: Consumo ao longo do tempo
Principais consumidores: tarefas e recursos mais caros

Etapa 4: otimizar o uso do token¶

Identifique áreas de alto consumo¶

Procure padrões em seus relatórios:

Padrão	Possível causa	Solução
Uma tarefa usa 5x mais tokens que a média	Descrição da tarefa excessivamente ampla	Divida em tarefas menores e focadas
Consumo de Claude 4.5 é alto	Usando Claude para tarefas simples	Deixe o AI Factory selecionar automaticamente o modelo ideal
As tarefas de refatoração custam muito caro	DeepSeek não está sendo usado	Verifique as configurações de preferência do modelo
O uso de token aumenta em determinados dias	Envios de tarefas em lote	Distribua os envios ao longo da semana

Estratégias de otimização¶

Escreva descrições precisas de tarefas: descrições vagas levam a mais consumo de tokens
Divida tarefas grandes em tarefas menores: mais fácil de estimar e controlar custos
Use preferências de modelo apropriadas: não force modelos caros para tarefas simples
Revise e ajuste os limites mensalmente: com base nos padrões de uso reais
Monitore semanalmente, não diariamente: procure tendências, não flutuações diárias

Etapa 5: Exportar relatórios¶

Opções de exportação¶

Clique em “Exportar Relatório”
Escolha o formato:
CSV: para análise de planilhas
PDF: Para compartilhar com as partes interessadas
JSON: para processamento programático
Selecione o período
Escolha os dados a serem incluídos:
Detalhes da tarefa
Análise do modelo
Atribuição de custos
Resultados de portão de qualidade
Baixe o relatório

Melhores práticas¶

Planejamento Orçamentário¶

Comece de forma conservadora: defina um limite inferior e aumente conforme você entender o uso
Revisar mensalmente: ajuste com base nos padrões reais de consumo
Planejar picos: considere recursos maiores ou sprints de correção de bugs
Projetos separados: defina limites individuais por projeto para melhor controle

Otimização de custos¶

Use o roteamento automático do AI Factory: ele seleciona o modelo com melhor custo-benefício
Tarefas semelhantes em lote: reduz a sobrecarga de troca de contexto
Revisar tarefas com falha: tarefas com falha ainda consomem tokens — melhore as descrições das tarefas
Aproveite o DeepSeek: para refatoração e limpeza, é o mais econômico

Gerenciamento de equipe¶

Definir limites por desenvolvedor: se vários membros da equipe enviarem tarefas
Compartilhe relatórios de uso: mantenha a equipe informada sobre o consumo
Educar sobre eficiência: treine os membros da equipe para escrever descrições de tarefas eficazes
Analise semanalmente em equipe: discuta padrões de consumo e oportunidades de otimização

O que vem a seguir?¶

Saiba mais sobre o Private AI Gateway
Explore Compreendendo a fábrica de IA
Leia sobre Controle de qualidade automatizado e proteções de segurança

Precisa de ajuda?¶

Documentação: docs.4geeks.io
Discordância: Discordância
Suporte: disponível no painel do console

Ainda tem dúvidas? Pergunte na Discord or explore tutoriais