Vai al contenuto

🤖 Spiega con IA

Monitoraggio dell’utilizzo dei token con la dashboard di controllo in tempo reale

Panoramica

Il dashboard Real-Time Token Audit ti offre totale trasparenza sul consumo di “carburante” dell’IA. Monitora esattamente quanti token vengono consumati, in base a quali funzionalità e a quali modelli, con una protezione con limiti rigidi per evitare fatture a sorpresa.

In questo tutorial imparerai:

  • Come navigare nella dashboard di Token Audit
  • Come leggere i report sul consumo di token
  • Come impostare e gestire la protezione dei limiti rigidi
  • Come ottimizzare l’utilizzo dei token nei tuoi progetti
  • Come interpretare l’analisi basata su LiteLLM

Il dashboard di controllo dei token

┌──────────────────────────────────────────────────────────────┐
│  Token Audit Dashboard — Project: My SaaS App               │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  Monthly Budget: $150.00        Used: $87.50 (58%)          │
│  ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  │
│                                                              │
│  ┌─────────────┐ ┌─────────────┐ ┌─────────────┐           │
│  │ Tasks Today │ │ Avg Tokens  │ │ Cost/Task   │           │
│  │     12      │ │   8,450     │ │   $7.29     │           │
│  └─────────────┘ └─────────────┘ └─────────────┘           │
│                                                              │
│  Model Breakdown:                                            │
│  Claude 4.5   ████████████  42%  ($36.75)                   │
│  GPT-5        ████████████████████  38%  ($33.25)           │
│  Gemini 3 Pro ██████  14%  ($12.25)                         │
│  DeepSeek     ██  6%  ($5.25)                               │
│                                                              │
│  Recent Tasks:                                               │
│  ✅ Create auth endpoint     12,300 tokens  $9.84            │
│  ✅ Fix pagination bug        4,200 tokens  $3.36            │
│  🔄 Build dashboard UI       18,500 tokens  $14.80 (in prog) │
│  ⏳ Write unit tests          6,800 tokens  $5.44 (queued)   │
│                                                              │
│  [Set Hard Limit] [Export Report] [View Details]             │
└──────────────────────────────────────────────────────────────┘

Passaggio 1: esplora la dashboard

Sezione panoramica

Metrico Descrizione
Budget mensile Il limite di spesa dei token configurato
Usato Consumo attuale e percentuale
Rimanente Budget rimasto per il ciclo di fatturazione
Giorni rimasti Giorni rimanenti nel ciclo attuale

Carte riassuntive

Carta Descrizione
Attività oggi Numero di attività AI presentate oggi
Token/attività medi Consumo medio di token per attività
Costo/Attività Costo medio per attività IA

Analisi del modello

Mostra il consumo di token per modello:

  • Grafico a barre visivo: utilizzo proporzionale per modello
  • Percentuale: Quota del consumo totale
  • Importo in dollari: Costo attribuito a ciascun modello

Attività recenti

Elenca le tue attività AI più recenti con:

  • Stato: Completato (✅), In corso (🔄), In coda (⏳), Non riuscito (❌)
  • Conteggio token: token totali consumati
  • Costo: importo in dollari speso

Passaggio 2: imposta la protezione con limite rigido

Configura limiti rigidi

  1. Fai clic su “Imposta limite rigido”
  2. Scegli il tipo di limite:
  3. Limite mensile: spesa massima per ciclo di fatturazione
  4. Limite giornaliero: spesa massima giornaliera
  5. Limite per attività: spesa massima per singola attività
  6. Imposta l’importo (ad esempio, $ 150 al mese)
  7. Scegli l’azione quando viene raggiunto il limite:
  8. Pausa: interrompi tutte le attività AI finché non le riprendi manualmente
  9. Avviso: invia la notifica ma continua l’elaborazione
  10. Fai clic su “Salva”

Limita le notifiche

Riceverai notifiche quando:

Soglia Notifica
utilizzato al 50% Informativo: “Hai utilizzato il 50% del tuo budget mensile”
75% utilizzato Avvertenza: “Hai utilizzato il 75%: valuta la possibilità di rivedere le priorità delle attività”
Utilizzato al 90% Avviso: “Hai utilizzato il 90%: ti stai avvicinando al limite rigido”
100% raggiunto Azione: attività in pausa (in modalità Pausa) o avviso finale (in modalità Avviso)

Passaggio 3: leggi i rapporti dettagliati

Rapporto a livello di attività

Fai clic su qualsiasi attività per visualizzare l’utilizzo dettagliato del token:

Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes

Token Breakdown:
├── Claude 4.5:    2,400 tokens  (Architecture design)
├── GPT-5:         8,200 tokens  (Code implementation)
├── Gemini 3 Pro:  1,800 tokens  (Architecture review)
├── DeepSeek:        900 tokens  (Code refactoring)
└── Total:        13,300 tokens  ($10.64)

Quality Gate:
├── Static Analysis:  PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests:       PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)

Rapporto a livello di progetto

  1. Vai a AnalisiRapporto progetto
  2. Seleziona l’intervallo di date
  3. Visualizza:
  4. Token totali consumati in tutte le attività
  5. Ripartizione dei costi per modello, tipo di attività e membro del team
  6. Analisi dell’andamento: Consumo nel tempo
  7. Consumatori principali: attività e funzionalità più costose

Passaggio 4: ottimizza l’utilizzo dei token

Identificare le aree ad alto consumo

Cerca modelli nei tuoi rapporti:

Modello Possibile causa Soluzione
Un’attività utilizza 5 volte più token della media Descrizione del compito eccessivamente ampia Suddividi in attività più piccole e mirate
Claude 4.5 il consumo è elevato Usare Claude per compiti semplici Lascia che AI ​​Factory selezioni automaticamente il modello ottimale
Le attività di refactoring costano troppo DeepSeek non viene utilizzato Controlla le impostazioni delle preferenze del modello
L’utilizzo dei token aumenta in determinati giorni Invii di attività batch Distribuisci le iscrizioni durante la settimana

Strategie di ottimizzazione

  1. Scrivi descrizioni precise delle attività: descrizioni vaghe portano a un maggiore consumo di token
  2. Suddividere le attività di grandi dimensioni in attività più piccole: stima e controllo dei costi più facili
  3. Utilizza le preferenze del modello appropriate: non forzare modelli costosi per attività semplici
  4. Verifica e modifica i limiti mensilmente: in base ai modelli di utilizzo effettivi
  5. Monitoraggio settimanale, non giornaliero: cerca le tendenze, non le fluttuazioni giornaliere

Passaggio 5: esporta i report

Opzioni di esportazione

  1. Fai clic su “Esporta rapporto”
  2. Scegli il formato:
  3. CSV: per l’analisi del foglio di calcolo
  4. PDF: da condividere con le parti interessate
  5. JSON: per l’elaborazione programmatica
  6. Seleziona l’intervallo di date
  7. Scegli i dati da includere:
  8. Dettagli dell’attività
  9. Ripartizione del modello
  10. Attribuzione dei costi
  11. Risultati del cancello di qualità
  12. Scarica il rapporto

Migliori pratiche

Pianificazione del budget

  • Inizia in modo conservativo: imposta un limite inferiore e aumentalo man mano che comprendi l’utilizzo
  • Revisione mensile: adeguamento in base ai modelli di consumo effettivi
  • Pianifica i picchi: tieni conto delle funzionalità più estese o degli sprint per la correzione dei bug
  • Progetti separati: imposta limiti individuali per progetto per un migliore controllo

Ottimizzazione dei costi

  • Utilizza il routing automatico di AI Factory: seleziona il modello più conveniente
  • Attività simili in batch: riduce il sovraccarico dovuto al cambio di contesto
  • Esamina le attività non riuscite: le attività non riuscite consumano comunque token: migliora le descrizioni delle attività
  • Sfrutta DeepSeek: per il refactoring e la pulizia, è il metodo più conveniente

Gestione della squadra

  • Imposta limiti per sviluppatore: se più membri del team inviano attività
  • Condividi report sull’utilizzo: mantieni il team informato sui consumi
  • Educare all’efficienza: formare i membri del team a scrivere descrizioni efficaci delle attività
  • Rivedi settimanalmente in gruppo: discuti i modelli di consumo e le opportunità di ottimizzazione

Qual è il prossimo passo?

Hai bisogno di aiuto?

  • Documentazione: docs.4geeks.io
  • Discord: Discord
  • Supporto: disponibile tramite il dashboard della console

Hai ancora domande? Richiedi supporto or explore tutoriali