Available Models

Dieser Inhalt ist für v1.0.0. Geh zur neuesten Version, um die aktuellste Dokumentation zu bekommen.

Dieser Inhalt ist noch nicht in deiner Sprache verfügbar.

Available Models

AI Foundation Services provides access to a wide range of open-source and proprietary LLMs, embedding models, vision models, and audio models — all through a single OpenAI-compatible API.

Featured Models

Verfügbare Modelle (56)

GLM 5.2 – Preview

Cloud: T-Cloud / Industrial AI Cloud Serverstandort: Germany Datenverarbeitung: Germany

Gemma 4

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Mistral Small 4

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

GPT-OSS 120B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Qwen3-Next 80B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Qwen3-VL 30B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Qwen3 Coder 30B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Llama 3.3 70B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Mistral Small 3

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Mistral Medium 3

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

GPT-5.2

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-5

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-5 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-5 Codex

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o4 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o3

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o3 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o1 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

Claude 4.6 Opus

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.6 Sonnet

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Opus

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Sonnet (>200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Sonnet (≤200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4.5 Haiku

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 4 Sonnet

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Claude 3.7 Sonnet

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3 Pro (>200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3 Pro (≤200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3 Flash

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Pro (>200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Pro (≤200k)

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Flash

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3 Pro Image

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 2.5 Flash Image

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

GPT-4.1

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-4.1 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-4.1 nano

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-4o

Cloud: Azure Serverstandort: France Datenverarbeitung: EU

GPT-4o mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-Image-1 (Text→Image)

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT-Image-1 (Image→Image)

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

BGE-M3

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Ada Text Embedding

Cloud: Azure Serverstandort: France Datenverarbeitung: EU

Jina Embeddings v2 Base DE

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Whisper Large v3

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Whisper Large v3 Turbo

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

Claude Opus 4.8

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3.1 Pro

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

Gemini 3.5 Flash

Cloud: GCP Serverstandort: Europe Datenverarbeitung: EU

GPT 5.4

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT 5.4 mini

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT 5.5

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

GPT Image 2

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

o1

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

Qwen 3 Coder 30B

Cloud: T-Cloud Serverstandort: Germany Datenverarbeitung: Germany

GPT 5.2

Cloud: Azure Serverstandort: Sweden Datenverarbeitung: EU

For a complete list with pricing, see the Plans & Pricing page.

List Models via API

curl "$OPENAI_BASE_URL/models" \
  -H "Authorization: Bearer $OPENAI_API_KEY"

from openai import OpenAI

client = OpenAI()

models = client.models.list()
for model in models.data:
    print(model.id)

import OpenAI from "openai";

const client = new OpenAI();

const models = await client.models.list();
for (const model of models.data) {
  console.log(model.id);
}

Model Metadata

Each model includes metadata you can inspect:

models = client.models.list()
print(models.data[0].meta_data)

{
  "model_type": "LLM",
  "source_type": "OPEN SOURCE",
  "max_sequence_length": 128000,
  "hidden_size": 0,
  "max_output_length": 0,
  "deployment_region": "otc-germany",
  "location": "otc-germany",
  "license": "https://www.llama.com/llama3_3/license/",
  "display_name": "Meta LLama 3.3 70B",
  "deployment_country": "Germany, EU",
  "input_modalities": ["text"],
  "output_modalities": ["text"],
  "model_lifecycle_stage": "Stable",
  "is_externally_hosted": false
}

Key fields:

model_type — LLM, EMBEDDING, STT (audio)
max_sequence_length — Maximum input + output tokens
hidden_size — Embedding vector dimensions (embedding models only)
max_output_length — Maximum output tokens the model can generate
deployment_region — Where the model is hosted (e.g., otc-germany for T-Cloud Germany)

Model Categories

Category	Examples	Use Case
LLM	Llama 3.3 70B, GPT 4.1, Claude Sonnet 4, Qwen 3	Text generation, chat, reasoning
Embedding	jina-embeddings-v2-base-de, text-embedding-bge-m3	Semantic search, RAG
Vision	Qwen3-VL-30B-A3B-Instruct-FP8, Gemini 2.5 Flash	Image analysis, multimodal chat
Audio/STT	whisper-large-v3, whisper-large-v3-turbo	Speech-to-text, translation
Image Generation	gpt-image-1	Image creation from text prompts

Hosting & Compliance

Open-source models are hosted on the T-Cloud in Germany, fully GDPR-compliant.
Proprietary models (GPT, Claude, Gemini) are hosted via MS Azure, AWS, or GCP in GDPR-compliant configurations.

All data processing stays within the EU.

Available Models

Available Models

Featured Models

Verfügbare Modelle (56)

GLM 5.2 – Preview

Gemma 4

Mistral Small 4

GPT-OSS 120B

Qwen3-Next 80B

Qwen3-VL 30B

Qwen3 Coder 30B

Llama 3.3 70B

Mistral Small 3

Mistral Medium 3

GPT-5.2

GPT-5

GPT-5 mini

GPT-5 Codex

o4 mini

o3

o3 mini

o1 mini

Claude 4.6 Opus

Claude 4.6 Sonnet

Claude 4.5 Opus

Claude 4.5 Sonnet (>200k)

Claude 4.5 Sonnet (≤200k)

Claude 4.5 Haiku

Claude 4 Sonnet

Claude 3.7 Sonnet

Gemini 3 Pro (>200k)

Gemini 3 Pro (≤200k)

Gemini 3 Flash

Gemini 2.5 Pro (>200k)

Gemini 2.5 Pro (≤200k)

Gemini 2.5 Flash

Gemini 3 Pro Image

Gemini 2.5 Flash Image

GPT-4.1

GPT-4.1 mini

GPT-4.1 nano

GPT-4o

GPT-4o mini

GPT-Image-1 (Text→Image)

GPT-Image-1 (Image→Image)

BGE-M3

Ada Text Embedding

Jina Embeddings v2 Base DE

Whisper Large v3

Whisper Large v3 Turbo

Claude Opus 4.8

Gemini 3.1 Pro

Gemini 3.5 Flash

GPT 5.4

GPT 5.4 mini

GPT 5.5

GPT Image 2

o1

Qwen 3 Coder 30B

GPT 5.2

List Models via API

Model Metadata

Model Categories

Hosting & Compliance

GLM‑5.2