Saltar a contenido

🤖 Explicar con IA

Monitoreo del uso de tokens con el panel de auditoría en tiempo real

Descripción general

El panel de Auditoría de tokens en tiempo real le brinda total transparencia sobre el consumo de “combustible” de la IA. Supervise exactamente cuántos tokens se consumen, mediante qué funciones y mediante qué modelos, con protección de límite estricto para garantizar que no haya facturas sorpresa.

En este tutorial, aprenderá:

  • Cómo navegar por el panel de auditoría de tokens
  • Cómo leer informes de consumo de tokens.
  • Cómo configurar y administrar la protección de límite estricto
  • Cómo optimizar el uso de tokens en tus proyectos
  • Cómo interpretar los análisis impulsados por LiteLLM

El panel de auditoría de tokens

┌──────────────────────────────────────────────────────────────┐
│  Token Audit Dashboard — Project: My SaaS App               │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  Monthly Budget: $150.00        Used: $87.50 (58%)          │
│  ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  │
│                                                              │
│  ┌─────────────┐ ┌─────────────┐ ┌─────────────┐           │
│  │ Tasks Today │ │ Avg Tokens  │ │ Cost/Task   │           │
│  │     12      │ │   8,450     │ │   $7.29     │           │
│  └─────────────┘ └─────────────┘ └─────────────┘           │
│                                                              │
│  Model Breakdown:                                            │
│  Claude 4.5   ████████████  42%  ($36.75)                   │
│  GPT-5        ████████████████████  38%  ($33.25)           │
│  Gemini 3 Pro ██████  14%  ($12.25)                         │
│  DeepSeek     ██  6%  ($5.25)                               │
│                                                              │
│  Recent Tasks:                                               │
│  ✅ Create auth endpoint     12,300 tokens  $9.84            │
│  ✅ Fix pagination bug        4,200 tokens  $3.36            │
│  🔄 Build dashboard UI       18,500 tokens  $14.80 (in prog) │
│  ⏳ Write unit tests          6,800 tokens  $5.44 (queued)   │
│                                                              │
│  [Set Hard Limit] [Export Report] [View Details]             │
└──────────────────────────────────────────────────────────────┘

Paso 1: navegar por el panel

Sección de descripción general

Métrica Descripción
Presupuesto mensual Su límite de gasto de token configurado
Usado Consumo actual y porcentaje
Restante Presupuesto restante para el ciclo de facturación
Quedan días Días restantes del ciclo actual

Tarjetas de resumen

Tarjeta Descripción
Tareas de hoy Número de tareas de IA enviadas hoy
Promedio de tokens/tarea Consumo medio de tokens por tarea
Costo/Tarea Costo promedio por tarea de IA

Desglose del modelo

Muestra el consumo de tokens por modelo:

  • Gráfico de barras visual: uso proporcional por modelo
  • Porcentaje: Participación del consumo total
  • Cantidad en dólares: Costo atribuido a cada modelo

Tareas recientes

Enumera tus tareas de IA más recientes con:

  • Estado: Completado (✅), En progreso (🔄), En cola (⏳), Fallido (❌)
  • Recuento de tokens: total de tokens consumidos
  • Costo: cantidad en dólares gastada

Paso 2: Establecer protección de límite estricto

Configurar límites estrictos

  1. Haga clic en “Establecer límite estricto”
  2. Elige tu tipo de límite:
  3. Límite mensual: gasto máximo por ciclo de facturación
  4. Límite diario: gasto máximo por día
  5. Límite por tarea: gasto máximo por tarea individual
  6. Establezca el monto (por ejemplo, $150/mes)
  7. Elija la acción cuando se alcance el límite:
  8. Pausa: detiene todas las tareas de IA hasta que las reanudes manualmente
  9. Alerta: enviar notificación pero continuar procesando
  10. Haga clic en “Guardar”

Limitar notificaciones

Recibirás notificaciones cuando:

Umbral Notificación
50% usado Informativo: “Has utilizado el 50% de tu presupuesto mensual”
75% usado Advertencia: “Has utilizado el 75 %; considera revisar las prioridades de las tareas”
90% usado Alerta: “Has usado el 90%, acercándote a tu límite”
100% alcanzado Acción: Tareas en pausa (si está en modo Pausa) o alerta final (si está en modo Alerta)

Paso 3: leer informes detallados

Informe a nivel de tarea

Haga clic en cualquier tarea para ver el uso detallado del token:

Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes

Token Breakdown:
├── Claude 4.5:    2,400 tokens  (Architecture design)
├── GPT-5:         8,200 tokens  (Code implementation)
├── Gemini 3 Pro:  1,800 tokens  (Architecture review)
├── DeepSeek:        900 tokens  (Code refactoring)
└── Total:        13,300 tokens  ($10.64)

Quality Gate:
├── Static Analysis:  PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests:       PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)

Informe a nivel de proyecto

  1. Vaya a AnálisisInforme del proyecto
  2. Seleccione el rango de fechas
  3. Ver:
  4. Total de tokens consumidos en todas las tareas
  5. Desglose de costos por modelo, tipo de tarea y miembro del equipo
  6. Análisis de tendencias: Consumo en el tiempo
  7. Consumidores principales: tareas y funciones más caras

Paso 4: Optimizar el uso del token

Identificar áreas de alto consumo

Busque patrones en sus informes:

Patrón Posible causa Solución
Una tarea utiliza 5 veces más tokens que el promedio Descripción de la tarea demasiado amplia Dividase en tareas más pequeñas y enfocadas
El consumo de Claude 4.5 es alto Usando Claude para tareas simples Deje que AI Factory seleccione automáticamente el modelo óptimo
Las tareas de refactorización cuestan demasiado DeepSeek no se utiliza Verifique la configuración de preferencias del modelo
El uso de tokens aumenta en ciertos días Envíos de tareas por lotes Distribuya las presentaciones a lo largo de la semana

Estrategias de optimización

  1. Escriba descripciones precisas de las tareas: las descripciones vagas generan un mayor consumo de tokens
  2. Divida las tareas grandes en otras más pequeñas: es más fácil estimar y controlar los costos
  3. Utilice preferencias de modelo apropiadas: no fuerce modelos costosos para tareas simples
  4. Revisar y ajustar los límites mensualmente: basado en patrones de uso reales
  5. Monitoree semanalmente, no diariamente: busque tendencias, no fluctuaciones diarias

Paso 5: Exportar informes

Opciones de exportación

  1. Haga clic en “Exportar informe”
  2. Elige formato:
  3. CSV: Para análisis de hojas de cálculo
  4. PDF: para compartir con las partes interesadas
  5. JSON: Para procesamiento programático
  6. Seleccione el rango de fechas
  7. Elija datos para incluir:
  8. Detalles de la tarea
  9. Desglose del modelo
  10. Atribución de costos
  11. Resultados de puerta de calidad
  12. Descarga el informe

Mejores prácticas

Planificación presupuestaria

  • Empiece de forma conservadora: establezca un límite inferior y aumente a medida que comprenda el uso
  • Revisión mensual: ajuste según los patrones de consumo reales
  • Plan para picos: cuenta para funciones más grandes o sprints de corrección de errores
  • Proyectos separados: establezca límites individuales por proyecto para un mejor control

Optimización de costos

  • Utilice el enrutamiento automático de AI Factory: selecciona el modelo más rentable
  • Tareas similares por lotes: reduce la sobrecarga del cambio de contexto
  • Revisar tareas fallidas: las tareas fallidas aún consumen tokens: mejore las descripciones de las tareas
  • Aproveche DeepSeek: para refactorización y limpieza, es el más rentable

Gestión de equipos

  • Establecer límites por desarrollador: si varios miembros del equipo envían tareas
  • Compartir informes de uso: mantenga al equipo informado sobre el consumo
  • Educar sobre la eficiencia: capacitar a los miembros del equipo para que escriban descripciones de tareas efectivas.
  • Revisión semanal en equipo: discutir patrones de consumo y oportunidades de optimización

¿Qué sigue?

¿Necesitas ayuda?


Aún con dudas? Pregunta en Discord o explore tutoriales