Monitoraggio dell’utilizzo dei token con la dashboard di controllo in tempo reale¶

Panoramica¶

Il dashboard Real-Time Token Audit ti offre totale trasparenza sul consumo di “carburante” dell’IA. Monitora esattamente quanti token vengono consumati, in base a quali funzionalità e a quali modelli, con una protezione con limiti rigidi per evitare fatture a sorpresa.

In questo tutorial imparerai:

Come navigare nella dashboard di Token Audit
Come leggere i report sul consumo di token
Come impostare e gestire la protezione dei limiti rigidi
Come ottimizzare l’utilizzo dei token nei tuoi progetti
Come interpretare l’analisi basata su LiteLLM

Il dashboard di controllo dei token¶

┌──────────────────────────────────────────────────────────────┐
│  Token Audit Dashboard — Project: My SaaS App               │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  Monthly Budget: $150.00        Used: $87.50 (58%)          │
│  ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  │
│                                                              │
│  ┌─────────────┐ ┌─────────────┐ ┌─────────────┐           │
│  │ Tasks Today │ │ Avg Tokens  │ │ Cost/Task   │           │
│  │     12      │ │   8,450     │ │   $7.29     │           │
│  └─────────────┘ └─────────────┘ └─────────────┘           │
│                                                              │
│  Model Breakdown:                                            │
│  Claude 4.5   ████████████  42%  ($36.75)                   │
│  GPT-5        ████████████████████  38%  ($33.25)           │
│  Gemini 3 Pro ██████  14%  ($12.25)                         │
│  DeepSeek     ██  6%  ($5.25)                               │
│                                                              │
│  Recent Tasks:                                               │
│  ✅ Create auth endpoint     12,300 tokens  $9.84            │
│  ✅ Fix pagination bug        4,200 tokens  $3.36            │
│  🔄 Build dashboard UI       18,500 tokens  $14.80 (in prog) │
│  ⏳ Write unit tests          6,800 tokens  $5.44 (queued)   │
│                                                              │
│  [Set Hard Limit] [Export Report] [View Details]             │
└──────────────────────────────────────────────────────────────┘

Passaggio 1: esplora la dashboard¶

Sezione panoramica¶

Metrico	Descrizione
Budget mensile	Il limite di spesa dei token configurato
Usato	Consumo attuale e percentuale
Rimanente	Budget rimasto per il ciclo di fatturazione
Giorni rimasti	Giorni rimanenti nel ciclo attuale

Carte riassuntive¶

Carta	Descrizione
Attività oggi	Numero di attività AI presentate oggi
Token/attività medi	Consumo medio di token per attività
Costo/Attività	Costo medio per attività IA

Analisi del modello¶

Mostra il consumo di token per modello:

Grafico a barre visivo: utilizzo proporzionale per modello
Percentuale: Quota del consumo totale
Importo in dollari: Costo attribuito a ciascun modello

Attività recenti¶

Elenca le tue attività AI più recenti con:

Stato: Completato (✅), In corso (🔄), In coda (⏳), Non riuscito (❌)
Conteggio token: token totali consumati
Costo: importo in dollari speso

Passaggio 2: imposta la protezione con limite rigido¶

Configura limiti rigidi¶

Fai clic su “Imposta limite rigido”
Scegli il tipo di limite:
Limite mensile: spesa massima per ciclo di fatturazione
Limite giornaliero: spesa massima giornaliera
Limite per attività: spesa massima per singola attività
Imposta l’importo (ad esempio, $ 150 al mese)
Scegli l’azione quando viene raggiunto il limite:
Pausa: interrompi tutte le attività AI finché non le riprendi manualmente
Avviso: invia la notifica ma continua l’elaborazione
Fai clic su “Salva”

Limita le notifiche¶

Riceverai notifiche quando:

Soglia	Notifica
utilizzato al 50%	Informativo: “Hai utilizzato il 50% del tuo budget mensile”
75% utilizzato	Avvertenza: “Hai utilizzato il 75%: valuta la possibilità di rivedere le priorità delle attività”
Utilizzato al 90%	Avviso: “Hai utilizzato il 90%: ti stai avvicinando al limite rigido”
100% raggiunto	Azione: attività in pausa (in modalità Pausa) o avviso finale (in modalità Avviso)

Passaggio 3: leggi i rapporti dettagliati¶

Rapporto a livello di attività¶

Fai clic su qualsiasi attività per visualizzare l’utilizzo dettagliato del token:

Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes

Token Breakdown:
├── Claude 4.5:    2,400 tokens  (Architecture design)
├── GPT-5:         8,200 tokens  (Code implementation)
├── Gemini 3 Pro:  1,800 tokens  (Architecture review)
├── DeepSeek:        900 tokens  (Code refactoring)
└── Total:        13,300 tokens  ($10.64)

Quality Gate:
├── Static Analysis:  PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests:       PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)

Rapporto a livello di progetto¶

Vai a Analisi → Rapporto progetto
Seleziona l’intervallo di date
Visualizza:
Token totali consumati in tutte le attività
Ripartizione dei costi per modello, tipo di attività e membro del team
Analisi dell’andamento: Consumo nel tempo
Consumatori principali: attività e funzionalità più costose

Passaggio 4: ottimizza l’utilizzo dei token¶

Identificare le aree ad alto consumo¶

Cerca modelli nei tuoi rapporti:

Modello	Possibile causa	Soluzione
Un’attività utilizza 5 volte più token della media	Descrizione del compito eccessivamente ampia	Suddividi in attività più piccole e mirate
Claude 4.5 il consumo è elevato	Usare Claude per compiti semplici	Lascia che AI Factory selezioni automaticamente il modello ottimale
Le attività di refactoring costano troppo	DeepSeek non viene utilizzato	Controlla le impostazioni delle preferenze del modello
L’utilizzo dei token aumenta in determinati giorni	Invii di attività batch	Distribuisci le iscrizioni durante la settimana

Strategie di ottimizzazione¶

Scrivi descrizioni precise delle attività: descrizioni vaghe portano a un maggiore consumo di token
Suddividere le attività di grandi dimensioni in attività più piccole: stima e controllo dei costi più facili
Utilizza le preferenze del modello appropriate: non forzare modelli costosi per attività semplici
Verifica e modifica i limiti mensilmente: in base ai modelli di utilizzo effettivi
Monitoraggio settimanale, non giornaliero: cerca le tendenze, non le fluttuazioni giornaliere

Passaggio 5: esporta i report¶

Opzioni di esportazione¶

Fai clic su “Esporta rapporto”
Scegli il formato:
CSV: per l’analisi del foglio di calcolo
PDF: da condividere con le parti interessate
JSON: per l’elaborazione programmatica
Seleziona l’intervallo di date
Scegli i dati da includere:
Dettagli dell’attività
Ripartizione del modello
Attribuzione dei costi
Risultati del cancello di qualità
Scarica il rapporto

Migliori pratiche¶

Pianificazione del budget¶

Inizia in modo conservativo: imposta un limite inferiore e aumentalo man mano che comprendi l’utilizzo
Revisione mensile: adeguamento in base ai modelli di consumo effettivi
Pianifica i picchi: tieni conto delle funzionalità più estese o degli sprint per la correzione dei bug
Progetti separati: imposta limiti individuali per progetto per un migliore controllo

Ottimizzazione dei costi¶

Utilizza il routing automatico di AI Factory: seleziona il modello più conveniente
Attività simili in batch: riduce il sovraccarico dovuto al cambio di contesto
Esamina le attività non riuscite: le attività non riuscite consumano comunque token: migliora le descrizioni delle attività
Sfrutta DeepSeek: per il refactoring e la pulizia, è il metodo più conveniente

Gestione della squadra¶

Imposta limiti per sviluppatore: se più membri del team inviano attività
Condividi report sull’utilizzo: mantieni il team informato sui consumi
Educare all’efficienza: formare i membri del team a scrivere descrizioni efficaci delle attività
Rivedi settimanalmente in gruppo: discuti i modelli di consumo e le opportunità di ottimizzazione

Qual è il prossimo passo?¶

Ulteriori informazioni su Private AI Gateway
Esplora Comprendere AI Factory
Leggi informazioni su QA automatizzato e barriere di sicurezza

Hai bisogno di aiuto?¶

Documentazione: docs.4geeks.io
Discord: Discord
Supporto: disponibile tramite il dashboard della console

Hai ancora domande? Richiedi supporto or explore tutoriali