Monitoreo del uso de tokens con el panel de auditoría en tiempo real¶

Descripción general¶

El panel de Auditoría de tokens en tiempo real le brinda total transparencia sobre el consumo de “combustible” de la IA. Supervise exactamente cuántos tokens se consumen, mediante qué funciones y mediante qué modelos, con protección de límite estricto para garantizar que no haya facturas sorpresa.

En este tutorial, aprenderá:

Cómo navegar por el panel de auditoría de tokens
Cómo leer informes de consumo de tokens.
Cómo configurar y administrar la protección de límite estricto
Cómo optimizar el uso de tokens en tus proyectos
Cómo interpretar los análisis impulsados por LiteLLM

El panel de auditoría de tokens¶

┌──────────────────────────────────────────────────────────────┐
│  Token Audit Dashboard — Project: My SaaS App               │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  Monthly Budget: $150.00        Used: $87.50 (58%)          │
│  ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  │
│                                                              │
│  ┌─────────────┐ ┌─────────────┐ ┌─────────────┐           │
│  │ Tasks Today │ │ Avg Tokens  │ │ Cost/Task   │           │
│  │     12      │ │   8,450     │ │   $7.29     │           │
│  └─────────────┘ └─────────────┘ └─────────────┘           │
│                                                              │
│  Model Breakdown:                                            │
│  Claude 4.5   ████████████  42%  ($36.75)                   │
│  GPT-5        ████████████████████  38%  ($33.25)           │
│  Gemini 3 Pro ██████  14%  ($12.25)                         │
│  DeepSeek     ██  6%  ($5.25)                               │
│                                                              │
│  Recent Tasks:                                               │
│  ✅ Create auth endpoint     12,300 tokens  $9.84            │
│  ✅ Fix pagination bug        4,200 tokens  $3.36            │
│  🔄 Build dashboard UI       18,500 tokens  $14.80 (in prog) │
│  ⏳ Write unit tests          6,800 tokens  $5.44 (queued)   │
│                                                              │
│  [Set Hard Limit] [Export Report] [View Details]             │
└──────────────────────────────────────────────────────────────┘

Paso 1: navegar por el panel¶

Sección de descripción general¶

Métrica	Descripción
Presupuesto mensual	Su límite de gasto de token configurado
Usado	Consumo actual y porcentaje
Restante	Presupuesto restante para el ciclo de facturación
Quedan días	Días restantes del ciclo actual

Tarjetas de resumen¶

Tarjeta	Descripción
Tareas de hoy	Número de tareas de IA enviadas hoy
Promedio de tokens/tarea	Consumo medio de tokens por tarea
Costo/Tarea	Costo promedio por tarea de IA

Desglose del modelo¶

Muestra el consumo de tokens por modelo:

Gráfico de barras visual: uso proporcional por modelo
Porcentaje: Participación del consumo total
Cantidad en dólares: Costo atribuido a cada modelo

Tareas recientes¶

Enumera tus tareas de IA más recientes con:

Estado: Completado (✅), En progreso (🔄), En cola (⏳), Fallido (❌)
Recuento de tokens: total de tokens consumidos
Costo: cantidad en dólares gastada

Paso 2: Establecer protección de límite estricto¶

Configurar límites estrictos¶

Haga clic en “Establecer límite estricto”
Elige tu tipo de límite:
Límite mensual: gasto máximo por ciclo de facturación
Límite diario: gasto máximo por día
Límite por tarea: gasto máximo por tarea individual
Establezca el monto (por ejemplo, $150/mes)
Elija la acción cuando se alcance el límite:
Pausa: detiene todas las tareas de IA hasta que las reanudes manualmente
Alerta: enviar notificación pero continuar procesando
Haga clic en “Guardar”

Limitar notificaciones¶

Recibirás notificaciones cuando:

Umbral	Notificación
50% usado	Informativo: “Has utilizado el 50% de tu presupuesto mensual”
75% usado	Advertencia: “Has utilizado el 75 %; considera revisar las prioridades de las tareas”
90% usado	Alerta: “Has usado el 90%, acercándote a tu límite”
100% alcanzado	Acción: Tareas en pausa (si está en modo Pausa) o alerta final (si está en modo Alerta)

Paso 3: leer informes detallados¶

Informe a nivel de tarea¶

Haga clic en cualquier tarea para ver el uso detallado del token:

Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes

Token Breakdown:
├── Claude 4.5:    2,400 tokens  (Architecture design)
├── GPT-5:         8,200 tokens  (Code implementation)
├── Gemini 3 Pro:  1,800 tokens  (Architecture review)
├── DeepSeek:        900 tokens  (Code refactoring)
└── Total:        13,300 tokens  ($10.64)

Quality Gate:
├── Static Analysis:  PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests:       PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)

Informe a nivel de proyecto¶

Vaya a Análisis → Informe del proyecto
Seleccione el rango de fechas
Ver:
Total de tokens consumidos en todas las tareas
Desglose de costos por modelo, tipo de tarea y miembro del equipo
Análisis de tendencias: Consumo en el tiempo
Consumidores principales: tareas y funciones más caras

Paso 4: Optimizar el uso del token¶

Identificar áreas de alto consumo¶

Busque patrones en sus informes:

Patrón	Posible causa	Solución
Una tarea utiliza 5 veces más tokens que el promedio	Descripción de la tarea demasiado amplia	Dividase en tareas más pequeñas y enfocadas
El consumo de Claude 4.5 es alto	Usando Claude para tareas simples	Deje que AI Factory seleccione automáticamente el modelo óptimo
Las tareas de refactorización cuestan demasiado	DeepSeek no se utiliza	Verifique la configuración de preferencias del modelo
El uso de tokens aumenta en ciertos días	Envíos de tareas por lotes	Distribuya las presentaciones a lo largo de la semana

Estrategias de optimización¶

Escriba descripciones precisas de las tareas: las descripciones vagas generan un mayor consumo de tokens
Divida las tareas grandes en otras más pequeñas: es más fácil estimar y controlar los costos
Utilice preferencias de modelo apropiadas: no fuerce modelos costosos para tareas simples
Revisar y ajustar los límites mensualmente: basado en patrones de uso reales
Monitoree semanalmente, no diariamente: busque tendencias, no fluctuaciones diarias

Paso 5: Exportar informes¶

Opciones de exportación¶

Haga clic en “Exportar informe”
Elige formato:
CSV: Para análisis de hojas de cálculo
PDF: para compartir con las partes interesadas
JSON: Para procesamiento programático
Seleccione el rango de fechas
Elija datos para incluir:
Detalles de la tarea
Desglose del modelo
Atribución de costos
Resultados de puerta de calidad
Descarga el informe

Mejores prácticas¶

Planificación presupuestaria¶

Empiece de forma conservadora: establezca un límite inferior y aumente a medida que comprenda el uso
Revisión mensual: ajuste según los patrones de consumo reales
Plan para picos: cuenta para funciones más grandes o sprints de corrección de errores
Proyectos separados: establezca límites individuales por proyecto para un mejor control

Optimización de costos¶

Utilice el enrutamiento automático de AI Factory: selecciona el modelo más rentable
Tareas similares por lotes: reduce la sobrecarga del cambio de contexto
Revisar tareas fallidas: las tareas fallidas aún consumen tokens: mejore las descripciones de las tareas
Aproveche DeepSeek: para refactorización y limpieza, es el más rentable

Gestión de equipos¶

Establecer límites por desarrollador: si varios miembros del equipo envían tareas
Compartir informes de uso: mantenga al equipo informado sobre el consumo
Educar sobre la eficiencia: capacitar a los miembros del equipo para que escriban descripciones de tareas efectivas.
Revisión semanal en equipo: discutir patrones de consumo y oportunidades de optimización

¿Qué sigue?¶

Obtenga más información sobre Private AI Gateway
Explora Comprensión de la fábrica de IA
Lea acerca de Control de calidad automatizado y barreras de seguridad

¿Necesitas ayuda?¶

Documentación: docs.4geeks.io
Discordia: Discordia
Soporte: disponible a través del panel de la consola

Aún con dudas? Pregunta en Discord o explore tutoriales