Ein Token ist die kleinste Abrechnungseinheit von Sprachmodellen — grob entspricht 1 Token etwa 0,75 Wörtern bzw. rund 4 Zeichen. Sowohl der Prompt (Input) als auch die Antwort (Output) werden in Tokens gemessen und getrennt abgerechnet.

AI & Automatisierung Geprüft Q2 / 2026 v 1.0.0

KI-Token-Kosten-Rechner (LLM-API)

Berechnen Sie die laufenden API-Kosten Ihrer KI-Nutzung (LLM): aus Anzahl der Anfragen, durchschnittlichen Input- und Output-Tokens je Anfrage sowie den Token-Preisen des Modells. Ergebnis je Anfrage, Tag, Monat und Jahr — mit Cache-Rabatt und USD/EUR-Umrechnung.

Anfragen pro Tag

Stück

Durchschnittliche Anzahl API-Aufrufe (Prompts) pro Tag. Input-Tokens je Anfrage

Tokens

Durchschnittliche Tokenzahl des Prompts inkl. Kontext (grob: 1 Token ≈ 0,75 Wörter). Output-Tokens je Anfrage

Tokens

Durchschnittliche Tokenzahl der Antwort. Preis Input je 1 Mio. Tokens

USD

Listenpreis des Modells für Input-Tokens (Referenzwerte siehe Methodik). Preis Output je 1 Mio. Tokens

USD

Listenpreis des Modells für Output-Tokens (Output ist meist deutlich teurer als Input). Anteil gecachter Input-Tokens

Anteil des Inputs aus dem Prompt-Cache; gecachte Tokens kosten meist nur rund 10 % des Input-Preises. Wechselkurs USD → EUR

EUR/USD

Umrechnungskurs für die Ausgabe in Euro.

Token-Preise je 1 Mio. Tokens in USD eingeben (Listenpreise der Anbieter).
Anfragen als Tagesdurchschnitt; Monat wird mit 30,4 Tagen gerechnet.
Token-Preise ändern sich häufig — Referenzwerte vor der Kalkulation prüfen.
Reine API-Kosten; Infrastruktur, Entwicklung und Betrieb sind nicht enthalten.

Wie wird gerechnet? · Methodik

Schätzung der reinen LLM-API-Kosten. Token-Preise ändern sich häufig und sind meist in USD angegeben; Infrastruktur- und Entwicklungskosten sind nicht enthalten.

Aus Tokenmengen je Anfrage und den Token-Preisen ergeben sich die Kosten je Anfrage, die mit der Anfragezahl und dem Wechselkurs auf Tag, Monat und Jahr hochgerechnet werden.

Kosten je Anfrage (USD)

eff. Input ÷ 1 Mio. × Input-Preis + Output ÷ 1 Mio. × Output-Preis

eff. Input-Tokens

Input × ((1 − Cache) + Cache × 0,1)

Monatskosten (EUR)

Kosten je Anfrage × Anfragen/Tag × 30,4 × Wechselkurs

Jahreskosten (EUR)

Kosten je Anfrage × Anfragen/Tag × 365 × Wechselkurs

Rechenweg & Annahmen

Effektive Input-Tokens = Input-Tokens × ((1 − Cache-Anteil) + Cache-Anteil × 0,1); gecachte Tokens kosten nur rund 10 %.
Kosten je Anfrage (USD) = effektive Input-Tokens ÷ 1.000.000 × Input-Preis + Output-Tokens ÷ 1.000.000 × Output-Preis.
Tageskosten = Kosten je Anfrage × Anfragen pro Tag; Monat = Tag × 30,4; Jahr = Tag × 365.
Alle Beträge werden mit dem angegebenen Wechselkurs von USD in EUR umgerechnet.
Output-Tokens sind bei den meisten Modellen deutlich teurer als Input-Tokens — lange Antworten treiben die Kosten überproportional.
Kosten je 1.000 Anfragen = Kosten je Anfrage × 1.000 — anschaulicher als der oft sehr kleine Einzelwert je Anfrage.

Referenzpreise (USD je 1 Mio. Tokens, Stand Mitte 2026)

OpenAI GPT-5.2: 1,75 Input / 14 Output
Anthropic Claude Opus 4.x: 5 Input / 25 Output
Anthropic Claude Sonnet 4.6: 3 Input / 15 Output
Anthropic Claude Haiku 4.5: 1 Input / 5 Output
Google Gemini 3.1 Pro: 2 Input / 12 Output
Google Gemini 3 Flash: 0,50 Input / 3 Output
Gecachter Input: meist rund 10 % des Input-Preises

Quellen & Prüfgrundlagen

OpenAI – API Pricing - offizielle Token-Preise der OpenAI-Modelle.
Anthropic Claude – API-Preise - offizielle Token-Preise für Claude Opus, Sonnet und Haiku.
Die Referenzpreise (Stand Mitte 2026) beruhen auf den veröffentlichten Listenpreisen der Anbieter und auf Marktübersichten zu LLM-API-Preisen; Preise ändern sich häufig.

Methodik & Quellen zuletzt geprüft: Juni 2026

Häufige Fragen

Was ist ein Token?

Warum ist Output teurer als Input?

Was bringt Prompt-Caching?

Sind die Preise aktuell?

Kosten pro Monat

Kosten je 1.000 Anfragen: --
Kosten pro Tag: --
Kosten pro Monat: --
Kosten pro Jahr: --
Tokens pro Monat (Mio.): --

KI und Automatisierung

Was kostet der Einsatz von KI-Tools wirklich? Eine vollständige Kostenanalyse

Die Lizenzgebühr ist nur die Spitze des Eisbergs. Dieser Artikel deckt alle 7 Kostenkategorien auf – von Integration bis Exit-Kosten – und zeigt, wie Sie realistisch kalkulieren.

31. MÄR 2026 9 MIN LESEZEIT

KI und Automatisierung

Die wahren Kosten von KI-Tools: Was hinter der monatlichen Gebühr steckt

80 % der KI-Kosten liegen unter der Oberfläche. Dieser Artikel legt alle Kostenschichten offen – von der Lizenz bis zu Exit-Kosten – und zeigt, wie Sie vollständig kalkulieren.

14. MAI 2026 14 MIN LESEZEIT

KI und Automatisierung

Was kann KI tatsächlich an Kosten einsparen? Konkrete Euro-Beträge statt vager Prozentangaben

Wie viel spart KI wirklich – in Euro? Mit konkreten Kalkulationsmodellen für Freelancer, KMU und Mittelstand zeigt dieser Artikel, was realistisch möglich ist.

16. JAN 2026 9 MIN LESEZEIT

KI-Token-Kosten-Rechner (LLM-API)

Eingaben

Wie wird gerechnet? · Methodik

Rechenweg & Annahmen

Referenzpreise (USD je 1 Mio. Tokens, Stand Mitte 2026)

Quellen & Prüfgrundlagen

Häufige Fragen

Verwandte Rechner

AI ROI Rechner

AI Support Einsparungsrechner