Monitorando o uso de token com o painel de auditoria em tempo real¶
Visão geral¶
O painel Auditoria de token em tempo real oferece total transparência no consumo de “combustível” de IA. Monitore exatamente quantos tokens estão sendo consumidos, por quais recursos e por quais modelos — com proteção de limite rígido para garantir que não haja faturas surpresas.
Neste tutorial, você aprenderá:
- Como navegar no painel Token Audit
- Como ler relatórios de consumo de tokens
- Como definir e gerenciar a proteção de limite rígido
- Como otimizar o uso de tokens em seus projetos
- Como interpretar as análises baseadas no LiteLLM
O painel de auditoria de token¶
┌──────────────────────────────────────────────────────────────┐
│ Token Audit Dashboard — Project: My SaaS App │
├──────────────────────────────────────────────────────────────┤
│ │
│ Monthly Budget: $150.00 Used: $87.50 (58%) │
│ ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░ │
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ Tasks Today │ │ Avg Tokens │ │ Cost/Task │ │
│ │ 12 │ │ 8,450 │ │ $7.29 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
│ Model Breakdown: │
│ Claude 4.5 ████████████ 42% ($36.75) │
│ GPT-5 ████████████████████ 38% ($33.25) │
│ Gemini 3 Pro ██████ 14% ($12.25) │
│ DeepSeek ██ 6% ($5.25) │
│ │
│ Recent Tasks: │
│ ✅ Create auth endpoint 12,300 tokens $9.84 │
│ ✅ Fix pagination bug 4,200 tokens $3.36 │
│ 🔄 Build dashboard UI 18,500 tokens $14.80 (in prog) │
│ ⏳ Write unit tests 6,800 tokens $5.44 (queued) │
│ │
│ [Set Hard Limit] [Export Report] [View Details] │
└──────────────────────────────────────────────────────────────┘
Etapa 1: navegue no painel¶
Seção Visão Geral¶
| Métrica | Descrição |
|---|---|
| Orçamento Mensal | Seu limite de gastos com token configurado |
| Usado | Consumo atual e percentagem |
| Restante | Orçamento restante para o ciclo de faturamento |
| Dias restantes | Dias restantes no ciclo atual |
Cartões de resumo¶
| Cartão | Descrição |
|---|---|
| Tarefas hoje | Número de tarefas de IA enviadas hoje |
| Média de tokens/tarefa | Consumo médio de tokens por tarefa |
| Custo/Tarefa | Custo médio por tarefa de IA |
Análise do modelo¶
Mostra o consumo de tokens por modelo:
- Gráfico de barras visual: uso proporcional por modelo
- Porcentagem: Participação no consumo total
- Valor em dólares: Custo atribuído a cada modelo
Tarefas Recentes¶
Lista suas tarefas de IA mais recentes com:
- Status: Concluído (✅), Em andamento (🔄), Na fila (⏳), Com falha (❌)
- Contagem de tokens: Total de tokens consumidos
- Custo: valor em dólares gasto
Etapa 2: Definir proteção de limite máximo¶
Configurar limites rígidos¶
- Clique em “Definir limite rígido”
- Escolha seu tipo de limite:
- Limite mensal: gasto máximo por ciclo de faturamento
- Limite diário: gasto máximo por dia
- Limite por tarefa: gasto máximo por tarefa individual
- Defina o valor (por exemplo, US$ 150/mês)
- Escolha a ação quando o limite for atingido:
- Pausa: Interrompa todas as tarefas de IA até retomar manualmente
- Alerta: Envie notificação, mas continue processando
- Clique em “Salvar”
Limitar notificações¶
Você receberá notificações quando:
| Limite | Notificação |
|---|---|
| 50% utilizado | Informativo: “Você usou 50% do seu orçamento mensal” |
| 75% utilizado | Aviso: “Você usou 75% – considere revisar as prioridades das tarefas” |
| 90% usado | Alerta: “Você usou 90% — aproximando-se do seu limite máximo” |
| 100% alcançado | Ação: Tarefas pausadas (se estiver no modo Pausa) ou alerta final (se estiver no modo Alerta) |
Etapa 3: Leia relatórios detalhados¶
Relatório em nível de tarefa¶
Clique em qualquer tarefa para ver o uso detalhado do token:
Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes
Token Breakdown:
├── Claude 4.5: 2,400 tokens (Architecture design)
├── GPT-5: 8,200 tokens (Code implementation)
├── Gemini 3 Pro: 1,800 tokens (Architecture review)
├── DeepSeek: 900 tokens (Code refactoring)
└── Total: 13,300 tokens ($10.64)
Quality Gate:
├── Static Analysis: PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests: PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)
Relatório em nível de projeto¶
- Vá para Analytics → Relatório do Projeto
- Selecione o período
- Visualizar:
- Total de tokens consumidos em todas as tarefas
- Detalhamento de custos por modelo, tipo de tarefa e membro da equipe
- Análise de tendências: Consumo ao longo do tempo
- Principais consumidores: tarefas e recursos mais caros
Etapa 4: otimizar o uso do token¶
Identifique áreas de alto consumo¶
Procure padrões em seus relatórios:
| Padrão | Possível causa | Solução |
|---|---|---|
| Uma tarefa usa 5x mais tokens que a média | Descrição da tarefa excessivamente ampla | Divida em tarefas menores e focadas |
| Consumo de Claude 4.5 é alto | Usando Claude para tarefas simples | Deixe o AI Factory selecionar automaticamente o modelo ideal |
| As tarefas de refatoração custam muito caro | DeepSeek não está sendo usado | Verifique as configurações de preferência do modelo |
| O uso de token aumenta em determinados dias | Envios de tarefas em lote | Distribua os envios ao longo da semana |
Estratégias de otimização¶
- Escreva descrições precisas de tarefas: descrições vagas levam a mais consumo de tokens
- Divida tarefas grandes em tarefas menores: mais fácil de estimar e controlar custos
- Use preferências de modelo apropriadas: não force modelos caros para tarefas simples
- Revise e ajuste os limites mensalmente: com base nos padrões de uso reais
- Monitore semanalmente, não diariamente: procure tendências, não flutuações diárias
Etapa 5: Exportar relatórios¶
Opções de exportação¶
- Clique em “Exportar Relatório”
- Escolha o formato:
- CSV: para análise de planilhas
- PDF: Para compartilhar com as partes interessadas
- JSON: para processamento programático
- Selecione o período
- Escolha os dados a serem incluídos:
- Detalhes da tarefa
- Análise do modelo
- Atribuição de custos
- Resultados de portão de qualidade
- Baixe o relatório
Melhores práticas¶
Planejamento Orçamentário¶
- Comece de forma conservadora: defina um limite inferior e aumente conforme você entender o uso
- Revisar mensalmente: ajuste com base nos padrões reais de consumo
- Planejar picos: considere recursos maiores ou sprints de correção de bugs
- Projetos separados: defina limites individuais por projeto para melhor controle
Otimização de custos¶
- Use o roteamento automático do AI Factory: ele seleciona o modelo com melhor custo-benefício
- Tarefas semelhantes em lote: reduz a sobrecarga de troca de contexto
- Revisar tarefas com falha: tarefas com falha ainda consomem tokens — melhore as descrições das tarefas
- Aproveite o DeepSeek: para refatoração e limpeza, é o mais econômico
Gerenciamento de equipe¶
- Definir limites por desenvolvedor: se vários membros da equipe enviarem tarefas
- Compartilhe relatórios de uso: mantenha a equipe informada sobre o consumo
- Educar sobre eficiência: treine os membros da equipe para escrever descrições de tarefas eficazes
- Analise semanalmente em equipe: discuta padrões de consumo e oportunidades de otimização
O que vem a seguir?¶
- Saiba mais sobre o Private AI Gateway
- Explore Compreendendo a fábrica de IA
- Leia sobre Controle de qualidade automatizado e proteções de segurança
Precisa de ajuda?¶
- Documentação: docs.4geeks.io
- Discordância: Discordância
- Suporte: disponível no painel do console
Ainda tem dúvidas? Pergunte na Discord or explore tutoriais