Zum Inhalt

🤖 Erklären mit KI

Überwachung der Token-Nutzung mit dem Echtzeit-Audit-Dashboard

Übersicht

Das Echtzeit-Token-Audit-Dashboard bietet Ihnen vollständige Transparenz über den KI-„Kraftstoffverbrauch“. Überwachen Sie genau, wie viele Token von welchen Funktionen und von welchen Modellen verbraucht werden – mit Hard-Limit-Schutz, um überraschende Rechnungen zu vermeiden.

In diesem Tutorial lernen Sie:

  • So navigieren Sie im Token Audit-Dashboard
  • So lesen Sie Token-Verbrauchsberichte
  • So richten Sie den Hard-Limit-Schutz ein und verwalten ihn
  • So optimieren Sie die Token-Nutzung in Ihren Projekten
  • Wie man die LiteLLM-gestützten Analysen interpretiert

Das Token-Audit-Dashboard

┌──────────────────────────────────────────────────────────────┐
│  Token Audit Dashboard — Project: My SaaS App               │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  Monthly Budget: $150.00        Used: $87.50 (58%)          │
│  ████████████████░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  │
│                                                              │
│  ┌─────────────┐ ┌─────────────┐ ┌─────────────┐           │
│  │ Tasks Today │ │ Avg Tokens  │ │ Cost/Task   │           │
│  │     12      │ │   8,450     │ │   $7.29     │           │
│  └─────────────┘ └─────────────┘ └─────────────┘           │
│                                                              │
│  Model Breakdown:                                            │
│  Claude 4.5   ████████████  42%  ($36.75)                   │
│  GPT-5        ████████████████████  38%  ($33.25)           │
│  Gemini 3 Pro ██████  14%  ($12.25)                         │
│  DeepSeek     ██  6%  ($5.25)                               │
│                                                              │
│  Recent Tasks:                                               │
│  ✅ Create auth endpoint     12,300 tokens  $9.84            │
│  ✅ Fix pagination bug        4,200 tokens  $3.36            │
│  🔄 Build dashboard UI       18,500 tokens  $14.80 (in prog) │
│  ⏳ Write unit tests          6,800 tokens  $5.44 (queued)   │
│                                                              │
│  [Set Hard Limit] [Export Report] [View Details]             │
└──────────────────────────────────────────────────────────────┘

Schritt 1: Navigieren Sie im Dashboard

Übersichtsbereich

Metrisch Beschreibung
Monatsbudget Ihre konfigurierte Token-Ausgabenobergrenze
Gebraucht Aktueller Verbrauch und Prozentsatz
Verbleibend Für den Abrechnungszeitraum verbleibendes Budget
Verbleibende Tage Verbleibende Tage im aktuellen Zyklus

Zusammenfassungskarten

Karte Beschreibung
Aufgaben heute Anzahl der heute eingereichten KI-Aufgaben
Durchschn. Tokens/Aufgabe Durchschnittlicher Tokenverbrauch pro Aufgabe
Kosten/Aufgabe Durchschnittliche Kosten pro KI-Aufgabe

Modellaufschlüsselung

Zeigt den Tokenverbrauch nach Modell an:

  • Visuelles Balkendiagramm: Proportionale Nutzung pro Modell
  • Prozentsatz: Anteil am Gesamtverbrauch
  • Dollarbetrag: Kosten, die jedem Modell zugeordnet werden

Letzte Aufgaben

Listet Ihre letzten KI-Aufgaben auf mit:

  • Status: Abgeschlossen (✅), In Bearbeitung (🔄), In der Warteschlange (⏳), Fehlgeschlagen (❌)
  • Token-Anzahl: Gesamtzahl der verbrauchten Token
  • Kosten: ausgegebener Dollarbetrag

Schritt 2: Festlegen des Hard-Limit-Schutzes

Konfigurieren Sie harte Grenzwerte

  1. Klicken Sie auf „Hard Limit festlegen“
  2. Wählen Sie Ihren Limittyp:
  3. Monatliche Obergrenze: Maximale Ausgaben pro Abrechnungszeitraum
  4. Tagesobergrenze: Maximale Ausgaben pro Tag
  5. Obergrenze pro Aufgabe: Maximale Ausgaben pro einzelne Aufgabe
  6. Legen Sie den Betrag fest (z. B. 150 $/Monat)
  7. Wählen Sie die Aktion, wenn das Limit erreicht ist:
  8. Pause: Stoppen Sie alle KI-Aufgaben, bis Sie manuell fortfahren
  9. Benachrichtigung: Benachrichtigung senden, aber Verarbeitung fortsetzen
  10. Klicken Sie auf „Speichern“

Benachrichtigungen einschränken

Sie erhalten Benachrichtigungen, wenn:

Schwelle Benachrichtigung
50 % gebraucht Zur Information: „Sie haben 50 % Ihres Monatsbudgets aufgebraucht“
75 % gebraucht Warnung: „Sie haben 75 % verbraucht – prüfen Sie die Aufgabenprioritäten“
90 % gebraucht Warnung: „Sie haben 90 % verbraucht – Sie nähern sich Ihrem harten Limit“
100 % erreicht Aktion: Aufgaben angehalten (im Pausenmodus) oder letzte Warnung (im Warnungsmodus)

Schritt 3: Detaillierte Berichte lesen

Bericht auf Aufgabenebene

Klicken Sie auf eine Aufgabe, um die detaillierte Token-Nutzung anzuzeigen:

Task: "Create user authentication endpoint"
Status: Completed
Duration: 4 minutes

Token Breakdown:
├── Claude 4.5:    2,400 tokens  (Architecture design)
├── GPT-5:         8,200 tokens  (Code implementation)
├── Gemini 3 Pro:  1,800 tokens  (Architecture review)
├── DeepSeek:        900 tokens  (Code refactoring)
└── Total:        13,300 tokens  ($10.64)

Quality Gate:
├── Static Analysis:  PASS (Score: A)
├── Vulnerability Scan: PASS (0 issues)
├── Unit Tests:       PASS (87% coverage)
└── Style Validation: PASS (auto-fixed 2 issues)

Bericht auf Projektebene

  1. Gehen Sie zu AnalyticsProjektbericht
  2. Wählen Sie den Datumsbereich aus
  3. Ansicht:
  4. Gesamtzahl der verbrauchten Token für alle Aufgaben
  5. Kostenaufschlüsselung nach Modell, Aufgabentyp und Teammitglied
  6. Trendanalyse: Verbrauch im Zeitverlauf
  7. Top-Verbraucher: Die teuersten Aufgaben und Funktionen

Schritt 4: Token-Nutzung optimieren

Identifizieren Sie Gebiete mit hohem Verbrauch

Suchen Sie in Ihren Berichten nach Mustern:

Muster Mögliche Ursache Lösung
Eine Aufgabe verbraucht 5x mehr Token als der Durchschnitt Zu breite Aufgabenbeschreibung Unterteilen Sie sich in kleinere, fokussierte Aufgaben
Der Verbrauch von Claude 4.5 ist hoch Claude für einfache Aufgaben nutzen Lassen Sie AI Factory automatisch das optimale Modell auswählen
Refactoring-Aufgaben kosten zu viel DeepSeek wird nicht verwendet Modellpräferenzeinstellungen prüfen
An bestimmten Tagen steigt die Token-Nutzung stark an Batch-Aufgabenübermittlungen Verteilen Sie die Einsendungen über die Woche

Optimierungsstrategien

  1. Präzise Aufgabenbeschreibungen schreiben: Vage Beschreibungen führen zu mehr Token-Verbrauch
  2. Teilen Sie große Aufgaben in kleinere auf: Einfachere Kostenschätzung und -kontrolle
  3. Verwenden Sie geeignete Modellpräferenzen: Erzwingen Sie keine teuren Modelle für einfache Aufgaben
  4. Limits monatlich überprüfen und anpassen: Basierend auf tatsächlichen Nutzungsmustern
  5. Überwachen Sie wöchentlich, nicht täglich: Achten Sie auf Trends, nicht auf tägliche Schwankungen

Schritt 5: Berichte exportieren

Exportoptionen

  1. Klicken Sie auf “Bericht exportieren”
  2. Format wählen:
  3. CSV: Zur Tabellenkalkulationsanalyse
  4. PDF: Zum Teilen mit Stakeholdern
  5. JSON: Für programmgesteuerte Verarbeitung
  6. Wählen Sie den Datumsbereich aus
  7. Wählen Sie die einzuschließenden Daten aus:
  8. Aufgabendetails
  9. Modellaufschlüsselung
  10. Kostenzuordnung
  11. Quality-Gate-Ergebnisse
  12. Laden Sie den Bericht herunter

Best Practices

Budgetplanung

  • Konservativ beginnen: Legen Sie einen niedrigeren Grenzwert fest und erhöhen Sie ihn, wenn Sie die Nutzung verstehen
  • Monatliche Überprüfung: Anpassung basierend auf den tatsächlichen Verbrauchsmustern
  • Spitzen einplanen: Berücksichtigen Sie größere Funktionen oder Sprints zur Fehlerbehebung
  • Getrennte Projekte: Legen Sie für eine bessere Kontrolle individuelle Grenzwerte pro Projekt fest

Kostenoptimierung

  • Verwenden Sie das automatische Routing der AI Factory: Es wählt das kostengünstigste Modell aus
  • Stapelverarbeitung ähnlicher Aufgaben: Reduziert den Aufwand für den Kontextwechsel
  • Fehlgeschlagene Aufgaben überprüfen: Fehlgeschlagene Aufgaben verbrauchen immer noch Token – Aufgabenbeschreibungen verbessern
  • Nutzen Sie DeepSeek: Für Refactoring und Bereinigung ist es am kosteneffizientesten

Teammanagement

  • Limits pro Entwickler festlegen: Wenn mehrere Teammitglieder Aufgaben einreichen
  • Nutzungsberichte teilen: Halten Sie das Team über den Verbrauch auf dem Laufenden
  • Effizienzschulung: Schulen Sie Teammitglieder darin, effektive Aufgabenbeschreibungen zu verfassen
  • Wöchentliche Überprüfung im Team: Besprechen Sie Konsummuster und Optimierungsmöglichkeiten

Was kommt als nächstes?

Brauchen Sie Hilfe?


Noch Fragen? Get support or explore tutorials