Ir para o conteúdo

🤖 Explicar com IA

Monitorando o uso de token com o painel de auditoria em tempo real

Visão geral

O painel Auditoria de token em tempo real oferece total transparência no consumo de “combustível” de IA. Monitore exatamente quantos tokens estão sendo consumidos, por quais recursos e por quais modelos — com proteção de limite rígido para garantir que não haja faturas surpresas.

Neste tutorial, você aprenderá:

  • Como navegar no painel Token Audit
  • Como ler relatórios de consumo de tokens
  • Como definir e gerenciar a proteção de limite rígido
  • Como otimizar o uso de tokens em seus projetos
  • Como interpretar as análises baseadas no LiteLLM

O painel de auditoria de token

┌──────────────────────────────────────────────────────────────┐
│  Token Audit Dashboard — Project: My SaaS App               │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  Monthly Budget: $150.00        Used: $87.50 (58%)          │
│  ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  │
│                                                              │
│  ┌─────────────┐ ┌─────────────┐ ┌─────────────┐           │
│  │ Tasks Today │ │ Avg Tokens  │ │ Cost/Task   │           │
│  │     12      │ │   8,450     │ │   $7.29     │           │
│  └─────────────┘ └─────────────┘ └─────────────┘           │
│                                                              │
│  Model Breakdown:                                            │
│  Claude 4.5   ████████████  42%  ($36.75)                   │
│  GPT-5        ████████████████████  38%  ($33.25)           │
│  Gemini 3 Pro ██████  14%  ($12.25)                         │
│  DeepSeek     ██  6%  ($5.25)                               │
│                                                              │
│  Recent Tasks:                                               │
│  ✅ Create auth endpoint     12,300 tokens  $9.84            │
│  ✅ Fix pagination bug        4,200 tokens  $3.36            │
│  🔄 Build dashboard UI       18,500 tokens  $14.80 (in prog) │
│  ⏳ Write unit tests          6,800 tokens  $5.44 (queued)   │
│                                                              │
│  [Set Hard Limit] [Export Report] [View Details]             │
└──────────────────────────────────────────────────────────────┘

Etapa 1: navegue no painel

Seção Visão Geral

Métrica Descrição
Orçamento Mensal Seu limite de gastos com token configurado
Usado Consumo atual e percentagem
Restante Orçamento restante para o ciclo de faturamento
Dias restantes Dias restantes no ciclo atual

Cartões de resumo

Cartão Descrição
Tarefas hoje Número de tarefas de IA enviadas hoje
Média de tokens/tarefa Consumo médio de tokens por tarefa
Custo/Tarefa Custo médio por tarefa de IA

Análise do modelo

Mostra o consumo de tokens por modelo:

  • Gráfico de barras visual: uso proporcional por modelo
  • Porcentagem: Participação no consumo total
  • Valor em dólares: Custo atribuído a cada modelo

Tarefas Recentes

Lista suas tarefas de IA mais recentes com:

  • Status: Concluído (✅), Em andamento (🔄), Na fila (⏳), Com falha (❌)
  • Contagem de tokens: Total de tokens consumidos
  • Custo: valor em dólares gasto

Etapa 2: Definir proteção de limite máximo

Configurar limites rígidos

  1. Clique em “Definir limite rígido”
  2. Escolha seu tipo de limite:
  3. Limite mensal: gasto máximo por ciclo de faturamento
  4. Limite diário: gasto máximo por dia
  5. Limite por tarefa: gasto máximo por tarefa individual
  6. Defina o valor (por exemplo, US$ 150/mês)
  7. Escolha a ação quando o limite for atingido:
  8. Pausa: Interrompa todas as tarefas de IA até retomar manualmente
  9. Alerta: Envie notificação, mas continue processando
  10. Clique em “Salvar”

Limitar notificações

Você receberá notificações quando:

Limite Notificação
50% utilizado Informativo: “Você usou 50% do seu orçamento mensal”
75% utilizado Aviso: “Você usou 75% – considere revisar as prioridades das tarefas”
90% usado Alerta: “Você usou 90% — aproximando-se do seu limite máximo”
100% alcançado Ação: Tarefas pausadas (se estiver no modo Pausa) ou alerta final (se estiver no modo Alerta)

Etapa 3: Leia relatórios detalhados

Relatório em nível de tarefa

Clique em qualquer tarefa para ver o uso detalhado do token:

Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes

Token Breakdown:
├── Claude 4.5:    2,400 tokens  (Architecture design)
├── GPT-5:         8,200 tokens  (Code implementation)
├── Gemini 3 Pro:  1,800 tokens  (Architecture review)
├── DeepSeek:        900 tokens  (Code refactoring)
└── Total:        13,300 tokens  ($10.64)

Quality Gate:
├── Static Analysis:  PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests:       PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)

Relatório em nível de projeto

  1. Vá para AnalyticsRelatório do Projeto
  2. Selecione o período
  3. Visualizar:
  4. Total de tokens consumidos em todas as tarefas
  5. Detalhamento de custos por modelo, tipo de tarefa e membro da equipe
  6. Análise de tendências: Consumo ao longo do tempo
  7. Principais consumidores: tarefas e recursos mais caros

Etapa 4: otimizar o uso do token

Identifique áreas de alto consumo

Procure padrões em seus relatórios:

Padrão Possível causa Solução
Uma tarefa usa 5x mais tokens que a média Descrição da tarefa excessivamente ampla Divida em tarefas menores e focadas
Consumo de Claude 4.5 é alto Usando Claude para tarefas simples Deixe o AI Factory selecionar automaticamente o modelo ideal
As tarefas de refatoração custam muito caro DeepSeek não está sendo usado Verifique as configurações de preferência do modelo
O uso de token aumenta em determinados dias Envios de tarefas em lote Distribua os envios ao longo da semana

Estratégias de otimização

  1. Escreva descrições precisas de tarefas: descrições vagas levam a mais consumo de tokens
  2. Divida tarefas grandes em tarefas menores: mais fácil de estimar e controlar custos
  3. Use preferências de modelo apropriadas: não force modelos caros para tarefas simples
  4. Revise e ajuste os limites mensalmente: com base nos padrões de uso reais
  5. Monitore semanalmente, não diariamente: procure tendências, não flutuações diárias

Etapa 5: Exportar relatórios

Opções de exportação

  1. Clique em “Exportar Relatório”
  2. Escolha o formato:
  3. CSV: para análise de planilhas
  4. PDF: Para compartilhar com as partes interessadas
  5. JSON: para processamento programático
  6. Selecione o período
  7. Escolha os dados a serem incluídos:
  8. Detalhes da tarefa
  9. Análise do modelo
  10. Atribuição de custos
  11. Resultados de portão de qualidade
  12. Baixe o relatório

Melhores práticas

Planejamento Orçamentário

  • Comece de forma conservadora: defina um limite inferior e aumente conforme você entender o uso
  • Revisar mensalmente: ajuste com base nos padrões reais de consumo
  • Planejar picos: considere recursos maiores ou sprints de correção de bugs
  • Projetos separados: defina limites individuais por projeto para melhor controle

Otimização de custos

  • Use o roteamento automático do AI Factory: ele seleciona o modelo com melhor custo-benefício
  • Tarefas semelhantes em lote: reduz a sobrecarga de troca de contexto
  • Revisar tarefas com falha: tarefas com falha ainda consomem tokens — melhore as descrições das tarefas
  • Aproveite o DeepSeek: para refatoração e limpeza, é o mais econômico

Gerenciamento de equipe

  • Definir limites por desenvolvedor: se vários membros da equipe enviarem tarefas
  • Compartilhe relatórios de uso: mantenha a equipe informada sobre o consumo
  • Educar sobre eficiência: treine os membros da equipe para escrever descrições de tarefas eficazes
  • Analise semanalmente em equipe: discuta padrões de consumo e oportunidades de otimização

O que vem a seguir?

Precisa de ajuda?


Ainda tem dúvidas? Pergunte na Discord or explore tutoriais