Monitoraggio dell’utilizzo dei token con la dashboard di controllo in tempo reale¶
Panoramica¶
Il dashboard Real-Time Token Audit ti offre totale trasparenza sul consumo di “carburante” dell’IA. Monitora esattamente quanti token vengono consumati, in base a quali funzionalità e a quali modelli, con una protezione con limiti rigidi per evitare fatture a sorpresa.
In questo tutorial imparerai:
- Come navigare nella dashboard di Token Audit
- Come leggere i report sul consumo di token
- Come impostare e gestire la protezione dei limiti rigidi
- Come ottimizzare l’utilizzo dei token nei tuoi progetti
- Come interpretare l’analisi basata su LiteLLM
Il dashboard di controllo dei token¶
┌──────────────────────────────────────────────────────────────┐
│ Token Audit Dashboard — Project: My SaaS App │
├──────────────────────────────────────────────────────────────┤
│ │
│ Monthly Budget: $150.00 Used: $87.50 (58%) │
│ ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░ │
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ Tasks Today │ │ Avg Tokens │ │ Cost/Task │ │
│ │ 12 │ │ 8,450 │ │ $7.29 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
│ Model Breakdown: │
│ Claude 4.5 ████████████ 42% ($36.75) │
│ GPT-5 ████████████████████ 38% ($33.25) │
│ Gemini 3 Pro ██████ 14% ($12.25) │
│ DeepSeek ██ 6% ($5.25) │
│ │
│ Recent Tasks: │
│ ✅ Create auth endpoint 12,300 tokens $9.84 │
│ ✅ Fix pagination bug 4,200 tokens $3.36 │
│ 🔄 Build dashboard UI 18,500 tokens $14.80 (in prog) │
│ ⏳ Write unit tests 6,800 tokens $5.44 (queued) │
│ │
│ [Set Hard Limit] [Export Report] [View Details] │
└──────────────────────────────────────────────────────────────┘
Passaggio 1: esplora la dashboard¶
Sezione panoramica¶
| Metrico | Descrizione |
|---|---|
| Budget mensile | Il limite di spesa dei token configurato |
| Usato | Consumo attuale e percentuale |
| Rimanente | Budget rimasto per il ciclo di fatturazione |
| Giorni rimasti | Giorni rimanenti nel ciclo attuale |
Carte riassuntive¶
| Carta | Descrizione |
|---|---|
| Attività oggi | Numero di attività AI presentate oggi |
| Token/attività medi | Consumo medio di token per attività |
| Costo/Attività | Costo medio per attività IA |
Analisi del modello¶
Mostra il consumo di token per modello:
- Grafico a barre visivo: utilizzo proporzionale per modello
- Percentuale: Quota del consumo totale
- Importo in dollari: Costo attribuito a ciascun modello
Attività recenti¶
Elenca le tue attività AI più recenti con:
- Stato: Completato (✅), In corso (🔄), In coda (⏳), Non riuscito (❌)
- Conteggio token: token totali consumati
- Costo: importo in dollari speso
Passaggio 2: imposta la protezione con limite rigido¶
Configura limiti rigidi¶
- Fai clic su “Imposta limite rigido”
- Scegli il tipo di limite:
- Limite mensile: spesa massima per ciclo di fatturazione
- Limite giornaliero: spesa massima giornaliera
- Limite per attività: spesa massima per singola attività
- Imposta l’importo (ad esempio, $ 150 al mese)
- Scegli l’azione quando viene raggiunto il limite:
- Pausa: interrompi tutte le attività AI finché non le riprendi manualmente
- Avviso: invia la notifica ma continua l’elaborazione
- Fai clic su “Salva”
Limita le notifiche¶
Riceverai notifiche quando:
| Soglia | Notifica |
|---|---|
| utilizzato al 50% | Informativo: “Hai utilizzato il 50% del tuo budget mensile” |
| 75% utilizzato | Avvertenza: “Hai utilizzato il 75%: valuta la possibilità di rivedere le priorità delle attività” |
| Utilizzato al 90% | Avviso: “Hai utilizzato il 90%: ti stai avvicinando al limite rigido” |
| 100% raggiunto | Azione: attività in pausa (in modalità Pausa) o avviso finale (in modalità Avviso) |
Passaggio 3: leggi i rapporti dettagliati¶
Rapporto a livello di attività¶
Fai clic su qualsiasi attività per visualizzare l’utilizzo dettagliato del token:
Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes
Token Breakdown:
├── Claude 4.5: 2,400 tokens (Architecture design)
├── GPT-5: 8,200 tokens (Code implementation)
├── Gemini 3 Pro: 1,800 tokens (Architecture review)
├── DeepSeek: 900 tokens (Code refactoring)
└── Total: 13,300 tokens ($10.64)
Quality Gate:
├── Static Analysis: PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests: PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)
Rapporto a livello di progetto¶
- Vai a Analisi → Rapporto progetto
- Seleziona l’intervallo di date
- Visualizza:
- Token totali consumati in tutte le attività
- Ripartizione dei costi per modello, tipo di attività e membro del team
- Analisi dell’andamento: Consumo nel tempo
- Consumatori principali: attività e funzionalità più costose
Passaggio 4: ottimizza l’utilizzo dei token¶
Identificare le aree ad alto consumo¶
Cerca modelli nei tuoi rapporti:
| Modello | Possibile causa | Soluzione |
|---|---|---|
| Un’attività utilizza 5 volte più token della media | Descrizione del compito eccessivamente ampia | Suddividi in attività più piccole e mirate |
| Claude 4.5 il consumo è elevato | Usare Claude per compiti semplici | Lascia che AI Factory selezioni automaticamente il modello ottimale |
| Le attività di refactoring costano troppo | DeepSeek non viene utilizzato | Controlla le impostazioni delle preferenze del modello |
| L’utilizzo dei token aumenta in determinati giorni | Invii di attività batch | Distribuisci le iscrizioni durante la settimana |
Strategie di ottimizzazione¶
- Scrivi descrizioni precise delle attività: descrizioni vaghe portano a un maggiore consumo di token
- Suddividere le attività di grandi dimensioni in attività più piccole: stima e controllo dei costi più facili
- Utilizza le preferenze del modello appropriate: non forzare modelli costosi per attività semplici
- Verifica e modifica i limiti mensilmente: in base ai modelli di utilizzo effettivi
- Monitoraggio settimanale, non giornaliero: cerca le tendenze, non le fluttuazioni giornaliere
Passaggio 5: esporta i report¶
Opzioni di esportazione¶
- Fai clic su “Esporta rapporto”
- Scegli il formato:
- CSV: per l’analisi del foglio di calcolo
- PDF: da condividere con le parti interessate
- JSON: per l’elaborazione programmatica
- Seleziona l’intervallo di date
- Scegli i dati da includere:
- Dettagli dell’attività
- Ripartizione del modello
- Attribuzione dei costi
- Risultati del cancello di qualità
- Scarica il rapporto
Migliori pratiche¶
Pianificazione del budget¶
- Inizia in modo conservativo: imposta un limite inferiore e aumentalo man mano che comprendi l’utilizzo
- Revisione mensile: adeguamento in base ai modelli di consumo effettivi
- Pianifica i picchi: tieni conto delle funzionalità più estese o degli sprint per la correzione dei bug
- Progetti separati: imposta limiti individuali per progetto per un migliore controllo
Ottimizzazione dei costi¶
- Utilizza il routing automatico di AI Factory: seleziona il modello più conveniente
- Attività simili in batch: riduce il sovraccarico dovuto al cambio di contesto
- Esamina le attività non riuscite: le attività non riuscite consumano comunque token: migliora le descrizioni delle attività
- Sfrutta DeepSeek: per il refactoring e la pulizia, è il metodo più conveniente
Gestione della squadra¶
- Imposta limiti per sviluppatore: se più membri del team inviano attività
- Condividi report sull’utilizzo: mantieni il team informato sui consumi
- Educare all’efficienza: formare i membri del team a scrivere descrizioni efficaci delle attività
- Rivedi settimanalmente in gruppo: discuti i modelli di consumo e le opportunità di ottimizzazione
Qual è il prossimo passo?¶
- Ulteriori informazioni su Private AI Gateway
- Esplora Comprendere AI Factory
- Leggi informazioni su QA automatizzato e barriere di sicurezza
Hai bisogno di aiuto?¶
- Documentazione: docs.4geeks.io
- Discord: Discord
- Supporto: disponibile tramite il dashboard della console
Hai ancora domande? Richiedi supporto or explore tutoriali