Verfügbare Modelle
AI Foundation Services bietet Zugang zu einer breiten Palette von Open-Source- und proprietären LLMs, Embedding-Modellen, Vision-Modellen und Audio-Modellen — alles über eine einzige OpenAI-kompatible API.
Jedes gehostete Modell hat eine eigene Modellkarte mit Fähigkeiten, Souveränitäts-Bewertung, Preisen, Tarifverfügbarkeit und einem Anwendungsbeispiel. Durchstöbern Sie die Kategorien in der Seitenleiste oder verwenden Sie die untenstehende Tabelle.
Ausgewählte Modelle
Abschnitt betitelt „Ausgewählte Modelle“Verfügbare Modelle (46)
Gemma 4 – Preview
GPT-OSS 120B
Qwen3-Next 80B
Qwen3-VL 30B
Qwen3 Coder 30B
Llama 3.3 70B
Mistral Small 3
Mistral Medium 3
GPT-5.2
GPT-5
GPT-5 mini
GPT-5 Codex
o4 mini
o3
o3 mini
o1 mini
Claude 4.6 Opus
Claude 4.6 Sonnet
Claude 4.5 Opus
Claude 4.5 Sonnet (>200k)
Claude 4.5 Sonnet (≤200k)
Claude 4.5 Haiku
Claude 4 Sonnet
Claude 3.7 Sonnet
Gemini 3 Pro (>200k)
Gemini 3 Pro (≤200k)
Gemini 3 Flash
Gemini 2.5 Pro (>200k)
Gemini 2.5 Pro (≤200k)
Gemini 2.5 Flash
Gemini 2.5 Flash Image
GPT-4.1
GPT-4.1 mini
GPT-4.1 nano
GPT-4o
GPT-4o mini
GPT-Image-1 (Text→Image)
GPT-Image-1 (Image→Image)
BGE-M3
Ada Text Embedding
Jina Embeddings v2 Base DE
Whisper Large v3
Whisper Large v3 Turbo
o1
Qwen 3 Coder 30B
GPT 5.2
Eine vollständige Liste mit Preisen finden Sie auf der Seite Tarife & Preise.
Modelle über die API auflisten
Abschnitt betitelt „Modelle über die API auflisten“curl "$OPENAI_BASE_URL/models" \ -H "Authorization: Bearer $OPENAI_API_KEY"from openai import OpenAI
client = OpenAI()
models = client.models.list()for model in models.data: print(model.id)import OpenAI from "openai";
const client = new OpenAI();
const models = await client.models.list();for (const model of models.data) { console.log(model.id);}Modell-Metadaten
Abschnitt betitelt „Modell-Metadaten“Jedes Modell enthält Metadaten, die Sie einsehen können:
models = client.models.list()print(models.data[0].meta_data){ "model_type": "LLM", "source_type": "OPEN SOURCE", "max_sequence_length": 128000, "hidden_size": 0, "max_output_length": 0, "deployment_region": "otc-germany", "location": "otc-germany", "license": "https://www.llama.com/llama3_3/license/", "display_name": "Meta LLama 3.3 70B", "deployment_country": "Germany, EU", "input_modalities": ["text"], "output_modalities": ["text"], "model_lifecycle_stage": "Stable", "is_externally_hosted": false}Wichtige Felder:
- model_type —
LLM,EMBEDDING,STT(Audio) - max_sequence_length — Maximale Eingabe- + Ausgabe-Token
- hidden_size — Embedding-Vektor-Dimensionen (nur bei Embedding-Modellen)
- max_output_length — Maximale Ausgabe-Token, die das Modell generieren kann
- deployment_region — Wo das Modell gehostet wird (z. B.
otc-germanyfür T-Cloud Deutschland)
Modellkategorien
Abschnitt betitelt „Modellkategorien“| Kategorie | Beispiele | Anwendungsfall |
|---|---|---|
| LLM | Llama 3.3 70B, GPT 4.1, Claude Sonnet 4, Qwen 3 | Textgenerierung, Chat, Reasoning |
| Embedding | jina-embeddings-v2-base-de, text-embedding-bge-m3 | Semantische Suche, RAG |
| Vision | Qwen3-VL-30B-A3B-Instruct-FP8, Gemini 2.5 Flash | Bildanalyse, multimodaler Chat |
| Audio/STT | whisper-large-v3, whisper-large-v3-turbo | Sprache-zu-Text, Übersetzung |
| Image Generation | gpt-image-1 | Image Generation aus Textprompts |
Hosting & Compliance
Abschnitt betitelt „Hosting & Compliance“- Open-Source-Modelle werden von T-Systems auf der T-Cloud in Deutschland betrieben. Die Daten werden innerhalb der EU/EWR verarbeitet, nicht gespeichert und sind weder für die Telekom noch für Dritte einsehbar.
- Proprietäre Modelle (GPT, Claude, Gemini, Mistral Medium) werden an den jeweiligen Drittanbieter (Microsoft Azure oder Google Cloud) weitergeleitet, der Subunternehmer weltweit einsetzen kann. Mit der Auswahl eines dieser Modelle akzeptieren Sie die Bedingungen des Drittanbieters.
Kundendaten werden unabhängig vom gewählten Modell nicht zum Modelltraining genutzt.
Die vollständige Aufschlüsselung des Datenverarbeitungs-Modells in zwei Kategorien finden Sie unter Enterprise Trust.