Überwachung der Token-Nutzung mit dem Echtzeit-Audit-Dashboard¶

Übersicht¶

Das Echtzeit-Token-Audit-Dashboard bietet Ihnen vollständige Transparenz über den KI-„Kraftstoffverbrauch“. Überwachen Sie genau, wie viele Token von welchen Funktionen und von welchen Modellen verbraucht werden – mit Hard-Limit-Schutz, um überraschende Rechnungen zu vermeiden.

In diesem Tutorial lernen Sie:

So navigieren Sie im Token Audit-Dashboard
So lesen Sie Token-Verbrauchsberichte
So richten Sie den Hard-Limit-Schutz ein und verwalten ihn
So optimieren Sie die Token-Nutzung in Ihren Projekten
Wie man die LiteLLM-gestützten Analysen interpretiert

Das Token-Audit-Dashboard¶

┌──────────────────────────────────────────────────────────────┐
│  Token Audit Dashboard — Project: My SaaS App               │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  Monthly Budget: $150.00        Used: $87.50 (58%)          │
│  ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  │
│                                                              │
│  ┌─────────────┐ ┌─────────────┐ ┌─────────────┐           │
│  │ Tasks Today │ │ Avg Tokens  │ │ Cost/Task   │           │
│  │     12      │ │   8,450     │ │   $7.29     │           │
│  └─────────────┘ └─────────────┘ └─────────────┘           │
│                                                              │
│  Model Breakdown:                                            │
│  Claude 4.5   ████████████  42%  ($36.75)                   │
│  GPT-5        ████████████████████  38%  ($33.25)           │
│  Gemini 3 Pro ██████  14%  ($12.25)                         │
│  DeepSeek     ██  6%  ($5.25)                               │
│                                                              │
│  Recent Tasks:                                               │
│  ✅ Create auth endpoint     12,300 tokens  $9.84            │
│  ✅ Fix pagination bug        4,200 tokens  $3.36            │
│  🔄 Build dashboard UI       18,500 tokens  $14.80 (in prog) │
│  ⏳ Write unit tests          6,800 tokens  $5.44 (queued)   │
│                                                              │
│  [Set Hard Limit] [Export Report] [View Details]             │
└──────────────────────────────────────────────────────────────┘

Schritt 1: Navigieren Sie im Dashboard¶

Übersichtsbereich¶

Metrisch	Beschreibung
Monatsbudget	Ihre konfigurierte Token-Ausgabenobergrenze
Gebraucht	Aktueller Verbrauch und Prozentsatz
Verbleibend	Für den Abrechnungszeitraum verbleibendes Budget
Verbleibende Tage	Verbleibende Tage im aktuellen Zyklus

Zusammenfassungskarten¶

Karte	Beschreibung
Aufgaben heute	Anzahl der heute eingereichten KI-Aufgaben
Durchschn. Tokens/Aufgabe	Durchschnittlicher Tokenverbrauch pro Aufgabe
Kosten/Aufgabe	Durchschnittliche Kosten pro KI-Aufgabe

Modellaufschlüsselung¶

Zeigt den Tokenverbrauch nach Modell an:

Visuelles Balkendiagramm: Proportionale Nutzung pro Modell
Prozentsatz: Anteil am Gesamtverbrauch
Dollarbetrag: Kosten, die jedem Modell zugeordnet werden

Letzte Aufgaben¶

Listet Ihre letzten KI-Aufgaben auf mit:

Status: Abgeschlossen (✅), In Bearbeitung (🔄), In der Warteschlange (⏳), Fehlgeschlagen (❌)
Token-Anzahl: Gesamtzahl der verbrauchten Token
Kosten: ausgegebener Dollarbetrag

Schritt 2: Festlegen des Hard-Limit-Schutzes¶

Konfigurieren Sie harte Grenzwerte¶

Klicken Sie auf „Hard Limit festlegen“
Wählen Sie Ihren Limittyp:
Monatliche Obergrenze: Maximale Ausgaben pro Abrechnungszeitraum
Tagesobergrenze: Maximale Ausgaben pro Tag
Obergrenze pro Aufgabe: Maximale Ausgaben pro einzelne Aufgabe
Legen Sie den Betrag fest (z. B. 150 $/Monat)
Wählen Sie die Aktion, wenn das Limit erreicht ist:
Pause: Stoppen Sie alle KI-Aufgaben, bis Sie manuell fortfahren
Benachrichtigung: Benachrichtigung senden, aber Verarbeitung fortsetzen
Klicken Sie auf „Speichern“

Benachrichtigungen einschränken¶

Sie erhalten Benachrichtigungen, wenn:

Schwelle	Benachrichtigung
50 % gebraucht	Zur Information: „Sie haben 50 % Ihres Monatsbudgets aufgebraucht“
75 % gebraucht	Warnung: „Sie haben 75 % verbraucht – prüfen Sie die Aufgabenprioritäten“
90 % gebraucht	Warnung: „Sie haben 90 % verbraucht – Sie nähern sich Ihrem harten Limit“
100 % erreicht	Aktion: Aufgaben angehalten (im Pausenmodus) oder letzte Warnung (im Warnungsmodus)

Schritt 3: Detaillierte Berichte lesen¶

Bericht auf Aufgabenebene¶

Klicken Sie auf eine Aufgabe, um die detaillierte Token-Nutzung anzuzeigen:

Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes

Token Breakdown:
├── Claude 4.5:    2,400 tokens  (Architecture design)
├── GPT-5:         8,200 tokens  (Code implementation)
├── Gemini 3 Pro:  1,800 tokens  (Architecture review)
├── DeepSeek:        900 tokens  (Code refactoring)
└── Total:        13,300 tokens  ($10.64)

Quality Gate:
├── Static Analysis:  PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests:       PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)

Bericht auf Projektebene¶

Gehen Sie zu Analytics → Projektbericht
Wählen Sie den Datumsbereich aus
Ansicht:
Gesamtzahl der verbrauchten Token für alle Aufgaben
Kostenaufschlüsselung nach Modell, Aufgabentyp und Teammitglied
Trendanalyse: Verbrauch im Zeitverlauf
Top-Verbraucher: Die teuersten Aufgaben und Funktionen

Schritt 4: Token-Nutzung optimieren¶

Identifizieren Sie Gebiete mit hohem Verbrauch¶

Suchen Sie in Ihren Berichten nach Mustern:

Muster	Mögliche Ursache	Lösung
Eine Aufgabe verbraucht 5x mehr Token als der Durchschnitt	Zu breite Aufgabenbeschreibung	Unterteilen Sie sich in kleinere, fokussierte Aufgaben
Der Verbrauch von Claude 4.5 ist hoch	Claude für einfache Aufgaben nutzen	Lassen Sie AI Factory automatisch das optimale Modell auswählen
Refactoring-Aufgaben kosten zu viel	DeepSeek wird nicht verwendet	Modellpräferenzeinstellungen prüfen
An bestimmten Tagen steigt die Token-Nutzung stark an	Batch-Aufgabenübermittlungen	Verteilen Sie die Einsendungen über die Woche

Optimierungsstrategien¶

Präzise Aufgabenbeschreibungen schreiben: Vage Beschreibungen führen zu mehr Token-Verbrauch
Teilen Sie große Aufgaben in kleinere auf: Einfachere Kostenschätzung und -kontrolle
Verwenden Sie geeignete Modellpräferenzen: Erzwingen Sie keine teuren Modelle für einfache Aufgaben
Limits monatlich überprüfen und anpassen: Basierend auf tatsächlichen Nutzungsmustern
Überwachen Sie wöchentlich, nicht täglich: Achten Sie auf Trends, nicht auf tägliche Schwankungen

Schritt 5: Berichte exportieren¶

Exportoptionen¶

Klicken Sie auf “Bericht exportieren”
Format wählen:
CSV: Zur Tabellenkalkulationsanalyse
PDF: Zum Teilen mit Stakeholdern
JSON: Für programmgesteuerte Verarbeitung
Wählen Sie den Datumsbereich aus
Wählen Sie die einzuschließenden Daten aus:
Aufgabendetails
Modellaufschlüsselung
Kostenzuordnung
Quality-Gate-Ergebnisse
Laden Sie den Bericht herunter

Best Practices¶

Budgetplanung¶

Konservativ beginnen: Legen Sie einen niedrigeren Grenzwert fest und erhöhen Sie ihn, wenn Sie die Nutzung verstehen
Monatliche Überprüfung: Anpassung basierend auf den tatsächlichen Verbrauchsmustern
Spitzen einplanen: Berücksichtigen Sie größere Funktionen oder Sprints zur Fehlerbehebung
Getrennte Projekte: Legen Sie für eine bessere Kontrolle individuelle Grenzwerte pro Projekt fest

Kostenoptimierung¶

Verwenden Sie das automatische Routing der AI Factory: Es wählt das kostengünstigste Modell aus
Stapelverarbeitung ähnlicher Aufgaben: Reduziert den Aufwand für den Kontextwechsel
Fehlgeschlagene Aufgaben überprüfen: Fehlgeschlagene Aufgaben verbrauchen immer noch Token – Aufgabenbeschreibungen verbessern
Nutzen Sie DeepSeek: Für Refactoring und Bereinigung ist es am kosteneffizientesten

Teammanagement¶

Limits pro Entwickler festlegen: Wenn mehrere Teammitglieder Aufgaben einreichen
Nutzungsberichte teilen: Halten Sie das Team über den Verbrauch auf dem Laufenden
Effizienzschulung: Schulen Sie Teammitglieder darin, effektive Aufgabenbeschreibungen zu verfassen
Wöchentliche Überprüfung im Team: Besprechen Sie Konsummuster und Optimierungsmöglichkeiten

Was kommt als nächstes?¶

Erfahren Sie mehr über Private AI Gateway
Entdecken Sie Die KI-Fabrik verstehen
Lesen Sie mehr über Automatisierte Qualitätssicherung und Sicherheitsleitplanken

Brauchen Sie Hilfe?¶

Dokumentation: docs.4geeks.io
Discord: Discord
Support: Verfügbar über das Konsolen-Dashboard

Noch Fragen? Get support or explore tutorials