Zum Inhalt springen

Available Models

Dieser Inhalt ist für v1.0.0. Geh zur neuesten Version, um die aktuellste Dokumentation zu bekommen.

Dieser Inhalt ist noch nicht in deiner Sprache verfügbar.

AI Foundation Services provides access to a wide range of open-source and proprietary LLMs, embedding models, vision models, and audio models — all through a single OpenAI-compatible API.


Verfügbare Modelle (45)

Gemma 4 – Preview

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

GPT-OSS 120B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Qwen3-Next 80B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Qwen3-VL 30B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Qwen3 Coder 30B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Llama 3.3 70B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Mistral Small 3

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Mistral Medium 3

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

GPT-5.2

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-5

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-5 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-5 Codex

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o4 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o3

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o3 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o1 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

Claude 4.6 Opus

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.6 Sonnet

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Opus

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Sonnet (>200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Sonnet (≤200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Haiku

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4 Sonnet

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 3.7 Sonnet

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3 Pro (>200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3 Pro (≤200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3 Flash

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Pro (>200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Pro (≤200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Flash

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Flash Image

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

GPT-4.1

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-4.1 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-4.1 nano

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-4o

Cloud: Azure Serverstandort: France Datenverarbeitung: EU

GPT-4o mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-Image-1 (Text→Image)

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-Image-1 (Image→Image)

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

BGE-M3

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Jina Embeddings v2 Base DE

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Whisper Large v3

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Whisper Large v3 Turbo

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

o1

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

Qwen 3 Coder 30B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

GPT 5.2

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

For a complete list with pricing, see the Plans & Pricing page.


Terminal window
curl "$OPENAI_BASE_URL/models" \
-H "Authorization: Bearer $OPENAI_API_KEY"

Each model includes metadata you can inspect:

models = client.models.list()
print(models.data[0].meta_data)
{
"model_type": "LLM",
"source_type": "OPEN SOURCE",
"max_sequence_length": 128000,
"hidden_size": 0,
"max_output_length": 0,
"deployment_region": "otc-germany",
"location": "otc-germany",
"license": "https://www.llama.com/llama3_3/license/",
"display_name": "Meta LLama 3.3 70B",
"deployment_country": "Germany, EU",
"input_modalities": ["text"],
"output_modalities": ["text"],
"model_lifecycle_stage": "Stable",
"is_externally_hosted": false
}

Key fields:

  • model_typeLLM, EMBEDDING, STT (audio)
  • max_sequence_length — Maximum input + output tokens
  • hidden_size — Embedding vector dimensions (embedding models only)
  • max_output_length — Maximum output tokens the model can generate
  • deployment_region — Where the model is hosted (e.g., otc-germany for T-Cloud Germany)

CategoryExamplesUse Case
LLMLlama 3.3 70B, GPT 4.1, Claude Sonnet 4, Qwen 3Text generation, chat, reasoning
Embeddingjina-embeddings-v2-base-de, text-embedding-bge-m3Semantic search, RAG
VisionQwen3-VL-30B-A3B-Instruct-FP8, Gemini 2.5 FlashImage analysis, multimodal chat
Audio/STTwhisper-large-v3, whisper-large-v3-turboSpeech-to-text, translation
Image Generationgpt-image-1Image creation from text prompts

  • Open-source models are hosted on the T-Cloud in Germany, fully GDPR-compliant.
  • Proprietary models (GPT, Claude, Gemini) are hosted via MS Azure, AWS, or GCP in GDPR-compliant configurations.

All data processing stays within the EU.