Überwachung der Token-Nutzung mit dem Echtzeit-Audit-Dashboard¶
Übersicht¶
Das Echtzeit-Token-Audit-Dashboard bietet Ihnen vollständige Transparenz über den KI-„Kraftstoffverbrauch“. Überwachen Sie genau, wie viele Token von welchen Funktionen und von welchen Modellen verbraucht werden – mit Hard-Limit-Schutz, um überraschende Rechnungen zu vermeiden.
In diesem Tutorial lernen Sie:
- So navigieren Sie im Token Audit-Dashboard
- So lesen Sie Token-Verbrauchsberichte
- So richten Sie den Hard-Limit-Schutz ein und verwalten ihn
- So optimieren Sie die Token-Nutzung in Ihren Projekten
- Wie man die LiteLLM-gestützten Analysen interpretiert
Das Token-Audit-Dashboard¶
┌──────────────────────────────────────────────────────────────┐
│ Token Audit Dashboard — Project: My SaaS App │
├──────────────────────────────────────────────────────────────┤
│ │
│ Monthly Budget: $150.00 Used: $87.50 (58%) │
│ ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░ │
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ Tasks Today │ │ Avg Tokens │ │ Cost/Task │ │
│ │ 12 │ │ 8,450 │ │ $7.29 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
│ Model Breakdown: │
│ Claude 4.5 ████████████ 42% ($36.75) │
│ GPT-5 ████████████████████ 38% ($33.25) │
│ Gemini 3 Pro ██████ 14% ($12.25) │
│ DeepSeek ██ 6% ($5.25) │
│ │
│ Recent Tasks: │
│ ✅ Create auth endpoint 12,300 tokens $9.84 │
│ ✅ Fix pagination bug 4,200 tokens $3.36 │
│ 🔄 Build dashboard UI 18,500 tokens $14.80 (in prog) │
│ ⏳ Write unit tests 6,800 tokens $5.44 (queued) │
│ │
│ [Set Hard Limit] [Export Report] [View Details] │
└──────────────────────────────────────────────────────────────┘
Schritt 1: Navigieren Sie im Dashboard¶
Übersichtsbereich¶
| Metrisch | Beschreibung |
|---|---|
| Monatsbudget | Ihre konfigurierte Token-Ausgabenobergrenze |
| Gebraucht | Aktueller Verbrauch und Prozentsatz |
| Verbleibend | Für den Abrechnungszeitraum verbleibendes Budget |
| Verbleibende Tage | Verbleibende Tage im aktuellen Zyklus |
Zusammenfassungskarten¶
| Karte | Beschreibung |
|---|---|
| Aufgaben heute | Anzahl der heute eingereichten KI-Aufgaben |
| Durchschn. Tokens/Aufgabe | Durchschnittlicher Tokenverbrauch pro Aufgabe |
| Kosten/Aufgabe | Durchschnittliche Kosten pro KI-Aufgabe |
Modellaufschlüsselung¶
Zeigt den Tokenverbrauch nach Modell an:
- Visuelles Balkendiagramm: Proportionale Nutzung pro Modell
- Prozentsatz: Anteil am Gesamtverbrauch
- Dollarbetrag: Kosten, die jedem Modell zugeordnet werden
Letzte Aufgaben¶
Listet Ihre letzten KI-Aufgaben auf mit:
- Status: Abgeschlossen (✅), In Bearbeitung (🔄), In der Warteschlange (⏳), Fehlgeschlagen (❌)
- Token-Anzahl: Gesamtzahl der verbrauchten Token
- Kosten: ausgegebener Dollarbetrag
Schritt 2: Festlegen des Hard-Limit-Schutzes¶
Konfigurieren Sie harte Grenzwerte¶
- Klicken Sie auf „Hard Limit festlegen“
- Wählen Sie Ihren Limittyp:
- Monatliche Obergrenze: Maximale Ausgaben pro Abrechnungszeitraum
- Tagesobergrenze: Maximale Ausgaben pro Tag
- Obergrenze pro Aufgabe: Maximale Ausgaben pro einzelne Aufgabe
- Legen Sie den Betrag fest (z. B. 150 $/Monat)
- Wählen Sie die Aktion, wenn das Limit erreicht ist:
- Pause: Stoppen Sie alle KI-Aufgaben, bis Sie manuell fortfahren
- Benachrichtigung: Benachrichtigung senden, aber Verarbeitung fortsetzen
- Klicken Sie auf „Speichern“
Benachrichtigungen einschränken¶
Sie erhalten Benachrichtigungen, wenn:
| Schwelle | Benachrichtigung |
|---|---|
| 50 % gebraucht | Zur Information: „Sie haben 50 % Ihres Monatsbudgets aufgebraucht“ |
| 75 % gebraucht | Warnung: „Sie haben 75 % verbraucht – prüfen Sie die Aufgabenprioritäten“ |
| 90 % gebraucht | Warnung: „Sie haben 90 % verbraucht – Sie nähern sich Ihrem harten Limit“ |
| 100 % erreicht | Aktion: Aufgaben angehalten (im Pausenmodus) oder letzte Warnung (im Warnungsmodus) |
Schritt 3: Detaillierte Berichte lesen¶
Bericht auf Aufgabenebene¶
Klicken Sie auf eine Aufgabe, um die detaillierte Token-Nutzung anzuzeigen:
Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes
Token Breakdown:
├── Claude 4.5: 2,400 tokens (Architecture design)
├── GPT-5: 8,200 tokens (Code implementation)
├── Gemini 3 Pro: 1,800 tokens (Architecture review)
├── DeepSeek: 900 tokens (Code refactoring)
└── Total: 13,300 tokens ($10.64)
Quality Gate:
├── Static Analysis: PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests: PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)
Bericht auf Projektebene¶
- Gehen Sie zu Analytics → Projektbericht
- Wählen Sie den Datumsbereich aus
- Ansicht:
- Gesamtzahl der verbrauchten Token für alle Aufgaben
- Kostenaufschlüsselung nach Modell, Aufgabentyp und Teammitglied
- Trendanalyse: Verbrauch im Zeitverlauf
- Top-Verbraucher: Die teuersten Aufgaben und Funktionen
Schritt 4: Token-Nutzung optimieren¶
Identifizieren Sie Gebiete mit hohem Verbrauch¶
Suchen Sie in Ihren Berichten nach Mustern:
| Muster | Mögliche Ursache | Lösung |
|---|---|---|
| Eine Aufgabe verbraucht 5x mehr Token als der Durchschnitt | Zu breite Aufgabenbeschreibung | Unterteilen Sie sich in kleinere, fokussierte Aufgaben |
| Der Verbrauch von Claude 4.5 ist hoch | Claude für einfache Aufgaben nutzen | Lassen Sie AI Factory automatisch das optimale Modell auswählen |
| Refactoring-Aufgaben kosten zu viel | DeepSeek wird nicht verwendet | Modellpräferenzeinstellungen prüfen |
| An bestimmten Tagen steigt die Token-Nutzung stark an | Batch-Aufgabenübermittlungen | Verteilen Sie die Einsendungen über die Woche |
Optimierungsstrategien¶
- Präzise Aufgabenbeschreibungen schreiben: Vage Beschreibungen führen zu mehr Token-Verbrauch
- Teilen Sie große Aufgaben in kleinere auf: Einfachere Kostenschätzung und -kontrolle
- Verwenden Sie geeignete Modellpräferenzen: Erzwingen Sie keine teuren Modelle für einfache Aufgaben
- Limits monatlich überprüfen und anpassen: Basierend auf tatsächlichen Nutzungsmustern
- Überwachen Sie wöchentlich, nicht täglich: Achten Sie auf Trends, nicht auf tägliche Schwankungen
Schritt 5: Berichte exportieren¶
Exportoptionen¶
- Klicken Sie auf “Bericht exportieren”
- Format wählen:
- CSV: Zur Tabellenkalkulationsanalyse
- PDF: Zum Teilen mit Stakeholdern
- JSON: Für programmgesteuerte Verarbeitung
- Wählen Sie den Datumsbereich aus
- Wählen Sie die einzuschließenden Daten aus:
- Aufgabendetails
- Modellaufschlüsselung
- Kostenzuordnung
- Quality-Gate-Ergebnisse
- Laden Sie den Bericht herunter
Best Practices¶
Budgetplanung¶
- Konservativ beginnen: Legen Sie einen niedrigeren Grenzwert fest und erhöhen Sie ihn, wenn Sie die Nutzung verstehen
- Monatliche Überprüfung: Anpassung basierend auf den tatsächlichen Verbrauchsmustern
- Spitzen einplanen: Berücksichtigen Sie größere Funktionen oder Sprints zur Fehlerbehebung
- Getrennte Projekte: Legen Sie für eine bessere Kontrolle individuelle Grenzwerte pro Projekt fest
Kostenoptimierung¶
- Verwenden Sie das automatische Routing der AI Factory: Es wählt das kostengünstigste Modell aus
- Stapelverarbeitung ähnlicher Aufgaben: Reduziert den Aufwand für den Kontextwechsel
- Fehlgeschlagene Aufgaben überprüfen: Fehlgeschlagene Aufgaben verbrauchen immer noch Token – Aufgabenbeschreibungen verbessern
- Nutzen Sie DeepSeek: Für Refactoring und Bereinigung ist es am kosteneffizientesten
Teammanagement¶
- Limits pro Entwickler festlegen: Wenn mehrere Teammitglieder Aufgaben einreichen
- Nutzungsberichte teilen: Halten Sie das Team über den Verbrauch auf dem Laufenden
- Effizienzschulung: Schulen Sie Teammitglieder darin, effektive Aufgabenbeschreibungen zu verfassen
- Wöchentliche Überprüfung im Team: Besprechen Sie Konsummuster und Optimierungsmöglichkeiten
Was kommt als nächstes?¶
- Erfahren Sie mehr über Private AI Gateway
- Entdecken Sie Die KI-Fabrik verstehen
- Lesen Sie mehr über Automatisierte Qualitätssicherung und Sicherheitsleitplanken
Brauchen Sie Hilfe?¶
- Dokumentation: docs.4geeks.io
- Discord: Discord
- Support: Verfügbar über das Konsolen-Dashboard
Noch Fragen? Get support or explore tutorials