Zum Inhalt springen

Available Models

Dieser Inhalt ist für v1.1.0. Geh zur neuesten Version, um die aktuellste Dokumentation zu bekommen.

Dieser Inhalt ist noch nicht in deiner Sprache verfügbar.

AI Foundation Services provides access to a wide range of open-source and proprietary LLMs, embedding models, vision models, and audio models — all through a single OpenAI-compatible API.

Every hosted model has an individual model card with capabilities, sovereignty rating, pricing, plan availability, and a usage example. Browse the categories in the sidebar or use the table below.

Verfügbare Modelle (46)

Gemma 4 – Preview

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

GPT-OSS 120B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Qwen3-Next 80B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Qwen3-VL 30B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Qwen3 Coder 30B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Llama 3.3 70B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Mistral Small 3

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Mistral Medium 3

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

GPT-5.2

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-5

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-5 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-5 Codex

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o4 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o3

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o3 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o1 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

Claude 4.6 Opus

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.6 Sonnet

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Opus

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Sonnet (>200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Sonnet (≤200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Haiku

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4 Sonnet

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 3.7 Sonnet

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3 Pro (>200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3 Pro (≤200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3 Flash

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Pro (>200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Pro (≤200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Flash

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Flash Image

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

GPT-4.1

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-4.1 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-4.1 nano

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-4o

Cloud: Azure Serverstandort: France Datenverarbeitung: EU

GPT-4o mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-Image-1 (Text→Image)

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-Image-1 (Image→Image)

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

BGE-M3

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Ada Text Embedding

Cloud: Azure Serverstandort: France Datenverarbeitung: EU

Jina Embeddings v2 Base DE

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Whisper Large v3

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Whisper Large v3 Turbo

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

o1

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

Qwen 3 Coder 30B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

GPT 5.2

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

For a complete list with pricing, see the Plans & Pricing page.

Terminal window
curl "$OPENAI_BASE_URL/models" \
-H "Authorization: Bearer $OPENAI_API_KEY"

Each model includes metadata you can inspect:

models = client.models.list()
print(models.data[0].meta_data)
{
"model_type": "LLM",
"source_type": "OPEN SOURCE",
"max_sequence_length": 128000,
"hidden_size": 0,
"max_output_length": 0,
"deployment_region": "otc-germany",
"location": "otc-germany",
"license": "https://www.llama.com/llama3_3/license/",
"display_name": "Meta LLama 3.3 70B",
"deployment_country": "Germany, EU",
"input_modalities": ["text"],
"output_modalities": ["text"],
"model_lifecycle_stage": "Stable",
"is_externally_hosted": false
}

Key fields:

  • model_typeLLM, EMBEDDING, STT (audio)
  • max_sequence_length — Maximum input + output tokens
  • hidden_size — Embedding vector dimensions (embedding models only)
  • max_output_length — Maximum output tokens the model can generate
  • deployment_region — Where the model is hosted (e.g., otc-germany for T-Cloud Germany)
CategoryExamplesUse Case
LLMLlama 3.3 70B, GPT 4.1, Claude Sonnet 4, Qwen 3Text generation, chat, reasoning
Embeddingjina-embeddings-v2-base-de, text-embedding-bge-m3Semantic search, RAG
VisionQwen3-VL-30B-A3B-Instruct-FP8, Gemini 2.5 FlashImage analysis, multimodal chat
Audio/STTwhisper-large-v3, whisper-large-v3-turboSpeech-to-text, translation
Image Generationgpt-image-1Image creation from text prompts
  • Open-source models are operated by T-Systems on the T-Cloud in Germany. Data is processed inside the EU/EEA, is not stored, and is not viewable by Telekom or third parties.
  • Proprietary models (GPT, Claude, Gemini, Mistral Medium) are forwarded to the upstream provider (Microsoft Azure or Google Cloud), who may use sub-processors worldwide. Selecting one of these models accepts the third-party provider’s terms.

Customer data is not used for model training, regardless of which model you select.

See Enterprise Trust for the full two-category data-handling breakdown.