Eingaben

  • Token-Preise je 1 Mio. Tokens in USD eingeben (Listenpreise der Anbieter).
  • Anfragen als Tagesdurchschnitt; Monat wird mit 30,4 Tagen gerechnet.
  • Token-Preise ändern sich häufig — Referenzwerte vor der Kalkulation prüfen.
  • Reine API-Kosten; Infrastruktur, Entwicklung und Betrieb sind nicht enthalten.

Wie wird gerechnet? · Methodik

Schätzung der reinen LLM-API-Kosten. Token-Preise ändern sich häufig und sind meist in USD angegeben; Infrastruktur- und Entwicklungskosten sind nicht enthalten.

Aus Tokenmengen je Anfrage und den Token-Preisen ergeben sich die Kosten je Anfrage, die mit der Anfragezahl und dem Wechselkurs auf Tag, Monat und Jahr hochgerechnet werden.

Kosten je Anfrage (USD)
eff. Input ÷ 1 Mio. × Input-Preis + Output ÷ 1 Mio. × Output-Preis
eff. Input-Tokens
Input × ((1 − Cache) + Cache × 0,1)
Monatskosten (EUR)
Kosten je Anfrage × Anfragen/Tag × 30,4 × Wechselkurs
Jahreskosten (EUR)
Kosten je Anfrage × Anfragen/Tag × 365 × Wechselkurs

Rechenweg & Annahmen

  • Effektive Input-Tokens = Input-Tokens × ((1 − Cache-Anteil) + Cache-Anteil × 0,1); gecachte Tokens kosten nur rund 10 %.
  • Kosten je Anfrage (USD) = effektive Input-Tokens ÷ 1.000.000 × Input-Preis + Output-Tokens ÷ 1.000.000 × Output-Preis.
  • Tageskosten = Kosten je Anfrage × Anfragen pro Tag; Monat = Tag × 30,4; Jahr = Tag × 365.
  • Alle Beträge werden mit dem angegebenen Wechselkurs von USD in EUR umgerechnet.
  • Output-Tokens sind bei den meisten Modellen deutlich teurer als Input-Tokens — lange Antworten treiben die Kosten überproportional.
  • Kosten je 1.000 Anfragen = Kosten je Anfrage × 1.000 — anschaulicher als der oft sehr kleine Einzelwert je Anfrage.

Referenzpreise (USD je 1 Mio. Tokens, Stand Mitte 2026)

  • OpenAI GPT-5.2: 1,75 Input / 14 Output
  • Anthropic Claude Opus 4.x: 5 Input / 25 Output
  • Anthropic Claude Sonnet 4.6: 3 Input / 15 Output
  • Anthropic Claude Haiku 4.5: 1 Input / 5 Output
  • Google Gemini 3.1 Pro: 2 Input / 12 Output
  • Google Gemini 3 Flash: 0,50 Input / 3 Output
  • Gecachter Input: meist rund 10 % des Input-Preises

Quellen & Prüfgrundlagen

  • OpenAI – API Pricing - offizielle Token-Preise der OpenAI-Modelle.
  • Anthropic Claude – API-Preise - offizielle Token-Preise für Claude Opus, Sonnet und Haiku.
  • Die Referenzpreise (Stand Mitte 2026) beruhen auf den veröffentlichten Listenpreisen der Anbieter und auf Marktübersichten zu LLM-API-Preisen; Preise ändern sich häufig.

Methodik & Quellen zuletzt geprüft: Juni 2026

Häufige Fragen

Bereit Geben Sie Werte ein, um das Ergebnis zu berechnen.
Kosten pro Monat
--

Berechnen Sie die laufenden API-Kosten Ihrer KI-Nutzung (LLM): aus Anzahl der Anfragen, durchschnittlichen Input- und Output-Tokens je Anfrage sowie den Token-Preisen des Modells. Ergebnis je Anfrage, Tag, Monat und Jahr — mit Cache-Rabatt und USD/EUR-Umrechnung.

Kosten je 1.000 Anfragen
--
Kosten pro Tag
--
Kosten pro Monat
--
Kosten pro Jahr
--
Tokens pro Monat (Mio.)
--

Verwandte Rechner

01 · AI & Automatisierung

AI ROI Rechner

Wirtschaftlichkeit von AI- und Automatisierungsprojekten für B2B-Entscheider schnell bewertbar machen.