Monitoreo del uso de tokens con el panel de auditoría en tiempo real¶
Descripción general¶
El panel de Auditoría de tokens en tiempo real le brinda total transparencia sobre el consumo de “combustible” de la IA. Supervise exactamente cuántos tokens se consumen, mediante qué funciones y mediante qué modelos, con protección de límite estricto para garantizar que no haya facturas sorpresa.
En este tutorial, aprenderá:
- Cómo navegar por el panel de auditoría de tokens
- Cómo leer informes de consumo de tokens.
- Cómo configurar y administrar la protección de límite estricto
- Cómo optimizar el uso de tokens en tus proyectos
- Cómo interpretar los análisis impulsados por LiteLLM
El panel de auditoría de tokens¶
┌──────────────────────────────────────────────────────────────┐
│ Token Audit Dashboard — Project: My SaaS App │
├──────────────────────────────────────────────────────────────┤
│ │
│ Monthly Budget: $150.00 Used: $87.50 (58%) │
│ ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░ │
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ Tasks Today │ │ Avg Tokens │ │ Cost/Task │ │
│ │ 12 │ │ 8,450 │ │ $7.29 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
│ Model Breakdown: │
│ Claude 4.5 ████████████ 42% ($36.75) │
│ GPT-5 ████████████████████ 38% ($33.25) │
│ Gemini 3 Pro ██████ 14% ($12.25) │
│ DeepSeek ██ 6% ($5.25) │
│ │
│ Recent Tasks: │
│ ✅ Create auth endpoint 12,300 tokens $9.84 │
│ ✅ Fix pagination bug 4,200 tokens $3.36 │
│ 🔄 Build dashboard UI 18,500 tokens $14.80 (in prog) │
│ ⏳ Write unit tests 6,800 tokens $5.44 (queued) │
│ │
│ [Set Hard Limit] [Export Report] [View Details] │
└──────────────────────────────────────────────────────────────┘
Paso 1: navegar por el panel¶
Sección de descripción general¶
| Métrica | Descripción |
|---|---|
| Presupuesto mensual | Su límite de gasto de token configurado |
| Usado | Consumo actual y porcentaje |
| Restante | Presupuesto restante para el ciclo de facturación |
| Quedan días | Días restantes del ciclo actual |
Tarjetas de resumen¶
| Tarjeta | Descripción |
|---|---|
| Tareas de hoy | Número de tareas de IA enviadas hoy |
| Promedio de tokens/tarea | Consumo medio de tokens por tarea |
| Costo/Tarea | Costo promedio por tarea de IA |
Desglose del modelo¶
Muestra el consumo de tokens por modelo:
- Gráfico de barras visual: uso proporcional por modelo
- Porcentaje: Participación del consumo total
- Cantidad en dólares: Costo atribuido a cada modelo
Tareas recientes¶
Enumera tus tareas de IA más recientes con:
- Estado: Completado (✅), En progreso (🔄), En cola (⏳), Fallido (❌)
- Recuento de tokens: total de tokens consumidos
- Costo: cantidad en dólares gastada
Paso 2: Establecer protección de límite estricto¶
Configurar límites estrictos¶
- Haga clic en “Establecer límite estricto”
- Elige tu tipo de límite:
- Límite mensual: gasto máximo por ciclo de facturación
- Límite diario: gasto máximo por día
- Límite por tarea: gasto máximo por tarea individual
- Establezca el monto (por ejemplo, $150/mes)
- Elija la acción cuando se alcance el límite:
- Pausa: detiene todas las tareas de IA hasta que las reanudes manualmente
- Alerta: enviar notificación pero continuar procesando
- Haga clic en “Guardar”
Limitar notificaciones¶
Recibirás notificaciones cuando:
| Umbral | Notificación |
|---|---|
| 50% usado | Informativo: “Has utilizado el 50% de tu presupuesto mensual” |
| 75% usado | Advertencia: “Has utilizado el 75 %; considera revisar las prioridades de las tareas” |
| 90% usado | Alerta: “Has usado el 90%, acercándote a tu límite” |
| 100% alcanzado | Acción: Tareas en pausa (si está en modo Pausa) o alerta final (si está en modo Alerta) |
Paso 3: leer informes detallados¶
Informe a nivel de tarea¶
Haga clic en cualquier tarea para ver el uso detallado del token:
Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes
Token Breakdown:
├── Claude 4.5: 2,400 tokens (Architecture design)
├── GPT-5: 8,200 tokens (Code implementation)
├── Gemini 3 Pro: 1,800 tokens (Architecture review)
├── DeepSeek: 900 tokens (Code refactoring)
└── Total: 13,300 tokens ($10.64)
Quality Gate:
├── Static Analysis: PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests: PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)
Informe a nivel de proyecto¶
- Vaya a Análisis → Informe del proyecto
- Seleccione el rango de fechas
- Ver:
- Total de tokens consumidos en todas las tareas
- Desglose de costos por modelo, tipo de tarea y miembro del equipo
- Análisis de tendencias: Consumo en el tiempo
- Consumidores principales: tareas y funciones más caras
Paso 4: Optimizar el uso del token¶
Identificar áreas de alto consumo¶
Busque patrones en sus informes:
| Patrón | Posible causa | Solución |
|---|---|---|
| Una tarea utiliza 5 veces más tokens que el promedio | Descripción de la tarea demasiado amplia | Dividase en tareas más pequeñas y enfocadas |
| El consumo de Claude 4.5 es alto | Usando Claude para tareas simples | Deje que AI Factory seleccione automáticamente el modelo óptimo |
| Las tareas de refactorización cuestan demasiado | DeepSeek no se utiliza | Verifique la configuración de preferencias del modelo |
| El uso de tokens aumenta en ciertos días | Envíos de tareas por lotes | Distribuya las presentaciones a lo largo de la semana |
Estrategias de optimización¶
- Escriba descripciones precisas de las tareas: las descripciones vagas generan un mayor consumo de tokens
- Divida las tareas grandes en otras más pequeñas: es más fácil estimar y controlar los costos
- Utilice preferencias de modelo apropiadas: no fuerce modelos costosos para tareas simples
- Revisar y ajustar los límites mensualmente: basado en patrones de uso reales
- Monitoree semanalmente, no diariamente: busque tendencias, no fluctuaciones diarias
Paso 5: Exportar informes¶
Opciones de exportación¶
- Haga clic en “Exportar informe”
- Elige formato:
- CSV: Para análisis de hojas de cálculo
- PDF: para compartir con las partes interesadas
- JSON: Para procesamiento programático
- Seleccione el rango de fechas
- Elija datos para incluir:
- Detalles de la tarea
- Desglose del modelo
- Atribución de costos
- Resultados de puerta de calidad
- Descarga el informe
Mejores prácticas¶
Planificación presupuestaria¶
- Empiece de forma conservadora: establezca un límite inferior y aumente a medida que comprenda el uso
- Revisión mensual: ajuste según los patrones de consumo reales
- Plan para picos: cuenta para funciones más grandes o sprints de corrección de errores
- Proyectos separados: establezca límites individuales por proyecto para un mejor control
Optimización de costos¶
- Utilice el enrutamiento automático de AI Factory: selecciona el modelo más rentable
- Tareas similares por lotes: reduce la sobrecarga del cambio de contexto
- Revisar tareas fallidas: las tareas fallidas aún consumen tokens: mejore las descripciones de las tareas
- Aproveche DeepSeek: para refactorización y limpieza, es el más rentable
Gestión de equipos¶
- Establecer límites por desarrollador: si varios miembros del equipo envían tareas
- Compartir informes de uso: mantenga al equipo informado sobre el consumo
- Educar sobre la eficiencia: capacitar a los miembros del equipo para que escriban descripciones de tareas efectivas.
- Revisión semanal en equipo: discutir patrones de consumo y oportunidades de optimización
¿Qué sigue?¶
- Obtenga más información sobre Private AI Gateway
- Explora Comprensión de la fábrica de IA
- Lea acerca de Control de calidad automatizado y barreras de seguridad
¿Necesitas ayuda?¶
- Documentación: docs.4geeks.io
- Discordia: Discordia
- Soporte: disponible a través del panel de la consola
Aún con dudas? Pregunta en Discord o explore tutoriales