FAQ
Was sind die AI Foundation Services?
Abschnitt betitelt „Was sind die AI Foundation Services?“Die AI Foundation Services von T-Systems bieten Unternehmen eine sichere, DSGVO-konforme Plattform für die Entwicklung und Skalierung von KI-Lösungen mit LLMs. Sie ermöglichen die Nutzung von über 40 Sprachmodellen — darunter Open-Source-Modelle wie Llama, Mistral, Qwen und Gemma — sowie fertige Dienste für RAG. Betrieben auf der T-Cloud in Deutschland, erfüllen sie höchste Anforderungen an Datenschutz und Datensouveränität.
Welche LLMs sind verfügbar?
Abschnitt betitelt „Welche LLMs sind verfügbar?“Die Auswahl wird kontinuierlich mit Open- und Closed-Source-Modellen aktualisiert, darunter Meta Llama, Mistral, DeepSeek, Qwen, OpenAI GPT und Claude Sonnet. T-Systems bietet unimodale und multimodale Modelle, die Text, Bild und Audio verarbeiten können. Siehe Verfügbare Modelle für die aktuelle Liste.
Auf welcher Cloud-Plattform wird das Hosting bereitgestellt?
Abschnitt betitelt „Auf welcher Cloud-Plattform wird das Hosting bereitgestellt?“Open-Source-Modelle werden von T-Systems auf der DSGVO-konformen T-Cloud in Deutschland betrieben. Closed-Source-Modelle werden an den jeweiligen Upstream-Anbieter auf Microsoft Azure oder Google Cloud weitergeleitet — siehe Enterprise Trust für das vollständige Datenverarbeitungs-Modell.
Kann ich die AI Foundation Services kostenlos testen?
Abschnitt betitelt „Kann ich die AI Foundation Services kostenlos testen?“Ja! Holen Sie sich einen kostenlosen Test-Schlüssel unter: API-Schlüssel-Portal
Wie ist die Preisstruktur aufgebaut?
Abschnitt betitelt „Wie ist die Preisstruktur aufgebaut?“Es gibt Komponenten für LLM und RAG. Die LLM-Komponente bietet verschiedene Tarife mit nutzungsbasierter Abrechnung der verbrauchten Tokens. Für RAG (SmartChat) wird eine monatliche Flatrate basierend auf Nutzern und Speicher vereinbart. Siehe die Seite Tarife & Preise für Details.
Was sind die Rate Limits?
Abschnitt betitelt „Was sind die Rate Limits?“Rate Limits (TPM und RPM) hängen vom gewählten Tarif und Modell ab. Beispielsweise sind für GPT-OSS 120B (T-Cloud, Deutschland) auf dem Essential-Tarif 300 * RPM und 300.000 * Eingabe-TPM ausgewiesen, skalierbar bis 1.000 * RPM und 2.000.000 * Eingabe-TPM auf Agentic. Premium-Modelle wie Claude Opus sind in den Tarifen Professional und Agentic verfügbar.
Die veröffentlichten RPM/TPM-Werte sind Best-Effort-Obergrenzen im Shared Service — nicht Teil des SLA. Für Open-Source-Modelle auf T-Cloud kann der effektive Durchsatz bei Lastspitzen niedriger ausfallen. Das Verfügbarkeits-SLA deckt ausschließlich die API-Erreichbarkeit ab, nicht Durchsatz oder Latenz. Für vertragliche Performance-Zusagen siehe Dedicated LLM Serving.
Siehe Rate Limits für die vollständige Aufschlüsselung.
Können zusätzliche LLMs bereitgestellt werden?
Abschnitt betitelt „Können zusätzliche LLMs bereitgestellt werden?“Ja, auf Anfrage können zusätzliche Modelle auf dedizierten GPU-Ressourcen gehostet werden. In diesem Fall erfolgt die Abrechnung auf Basis der benötigten GPU-Ressourcen statt nutzungsbasiert. Kontaktieren Sie das AIFS-Team für Details.
Wie bestelle ich LLM-Serving?
Abschnitt betitelt „Wie bestelle ich LLM-Serving?“Die Tarife Essential, Professional und Agentic können direkt über den T-Cloud Marketplace bestellt werden. Für Enterprise-Tarife (individuell) kontaktieren Sie uns für ein Angebot.
Wie bestelle ich SmartChat?
Abschnitt betitelt „Wie bestelle ich SmartChat?“Kontaktieren Sie uns für ein Angebot. Zukünftig wird die Bestellung auch über den T-Cloud Marketplace möglich sein.
Kann SmartChat in bestehende Anwendungen integriert werden?
Abschnitt betitelt „Kann SmartChat in bestehende Anwendungen integriert werden?“Ja, SmartChat kann über die SmartChat-API in bestehende Prozesse oder Anwendungen integriert werden. Verbinden Sie Datenbanken oder Systeme sicher für maximale Effizienz.