FAQ

Was sind die AI Foundation Services?

Die AI Foundation Services von T-Systems bieten Unternehmen eine sichere, DSGVO-konforme Plattform für die Entwicklung und Skalierung von KI-Lösungen mit LLMs. Sie ermöglichen die Nutzung von über 40 Sprachmodellen — darunter Open-Source-Modelle wie Llama, Mistral, Qwen und Gemma — sowie fertige Dienste für RAG. Betrieben auf der T-Cloud in Deutschland, erfüllen sie höchste Anforderungen an Datenschutz und Datensouveränität.

Welche LLMs sind verfügbar?

Die Auswahl wird kontinuierlich mit Open- und Closed-Source-Modellen aktualisiert, darunter Meta Llama, Mistral, DeepSeek, Qwen, OpenAI GPT und Claude Sonnet. T-Systems bietet unimodale und multimodale Modelle, die Text, Bild und Audio verarbeiten können. Siehe Verfügbare Modelle für die aktuelle Liste.

Auf welcher Cloud-Plattform wird das Hosting bereitgestellt?

Open-Source-Modelle werden von T-Systems auf der DSGVO-konformen T-Cloud in Deutschland betrieben. Closed-Source-Modelle werden an den jeweiligen Upstream-Anbieter auf Microsoft Azure oder Google Cloud weitergeleitet — siehe Enterprise Trust für das vollständige Datenverarbeitungs-Modell.

Kann ich die AI Foundation Services kostenlos testen?

Ja! Holen Sie sich einen kostenlosen Test-Schlüssel unter: API-Schlüssel-Portal

Wie ist die Preisstruktur aufgebaut?

Es gibt Komponenten für LLM und RAG. Die LLM-Komponente bietet verschiedene Tarife mit nutzungsbasierter Abrechnung der verbrauchten Tokens. Für RAG (SmartChat) wird eine monatliche Flatrate basierend auf Nutzern und Speicher vereinbart. Siehe die Seite Tarife & Preise für Details.

Was sind die Rate Limits?

Rate Limits (TPM und RPM) hängen vom gewählten Tarif und Modell ab. Beispielsweise sind für GPT-OSS 120B (T-Cloud, Deutschland) auf dem Essential-Tarif 300 ^* RPM und 300.000 ^* Eingabe-TPM ausgewiesen, skalierbar bis 1.000 ^* RPM und 2.000.000 ^* Eingabe-TPM auf Agentic. Premium-Modelle wie Claude Opus sind in den Tarifen Professional und Agentic verfügbar.

Die veröffentlichten RPM/TPM-Werte sind Best-Effort-Obergrenzen im Shared Service — nicht Teil des SLA. Für Open-Source-Modelle auf T-Cloud kann der effektive Durchsatz bei Lastspitzen niedriger ausfallen. Das Verfügbarkeits-SLA deckt ausschließlich die API-Erreichbarkeit ab, nicht Durchsatz oder Latenz. Für vertragliche Performance-Zusagen siehe Dedicated LLM Serving.

Siehe Rate Limits für die vollständige Aufschlüsselung.

Können zusätzliche LLMs bereitgestellt werden?

Ja, auf Anfrage können zusätzliche Modelle auf dedizierten GPU-Ressourcen gehostet werden. In diesem Fall erfolgt die Abrechnung auf Basis der benötigten GPU-Ressourcen statt nutzungsbasiert. Kontaktieren Sie das AIFS-Team für Details.

Wie bestelle ich LLM-Serving?

Die Tarife Essential, Professional und Agentic können direkt über den T-Cloud Marketplace bestellt werden. Für Enterprise-Tarife (individuell) kontaktieren Sie uns für ein Angebot.

Wie bestelle ich SmartChat?

Kontaktieren Sie uns für ein Angebot. Zukünftig wird die Bestellung auch über den T-Cloud Marketplace möglich sein.

Kann SmartChat in bestehende Anwendungen integriert werden?

Ja, SmartChat kann über die SmartChat-API in bestehende Prozesse oder Anwendungen integriert werden. Verbinden Sie Datenbanken oder Systeme sicher für maximale Effizienz.

FAQ