Anleitungen

Der Abschnitt „Anleitungen” beantwortet „Wie mache ich…”-Fragen. Jede Seite konzentriert sich auf eine einzelne Funktion: Sie zeigt den minimalen funktionsfähigen Code, erläutert die wichtigsten Parameter und weist auf plattformspezifisches Verhalten hin. Alle Beispiele verwenden die OpenAI-kompatible API, sodass vorhandener OpenAI-SDK-Code in der Regel mit einer einzeiligen Anpassung der Basis-URL funktioniert.

Wählen Sie unten ein Thema aus oder arbeiten Sie die Anleitungen der Reihe nach durch, wenn Sie neu bei AI Foundation Services sind.

Kern-API

Chat Completions Chat-Anfragen mit System- und Benutzernachrichten über die OpenAI-kompatible Chat-API von AI Foundation Services senden.

Streaming LLM-Antworten token-weise über Server-Sent Events streamen — für geringere Latenz und bessere Nutzererfahrung.

Embeddings Texteinbettungen für semantische Suche, Clustering und RAG-Anwendungen über die Embedding-API von AI Foundation Services generieren.

Function Calling Werkzeuge definieren und LLM-Hub-Modelle strukturierte JSON-Argumente zurückgeben lassen, um externe APIs und Datenquellen anzubinden.

Multimodal & Medien

Multimodal (Vision) Bilder zusammen mit Text über visionsfähige Modelle von AI Foundation Services mit der standardmäßigen Chat-Completions-API analysieren.

Audio (Sprache-zu-Text) Audiodateien mit Whisper-basierten Modellen von AI Foundation Services transkribieren und übersetzen, kompatibel mit der OpenAI Audio API.

Image Generation Bilder aus Textprompts über die OpenAI-kompatible Images-API von AI Foundation Services mit verfügbaren Bildmodellen generieren.

Erweitert

Reasoning Tiefe des Chain-of-Thought mit dem Parameter reasoning_effort bei unterstützten Modellen wie o1, Gemini 2.5 und Claude 4 steuern.

Visual RAG Dokumente mit kombinierter Text- und Bildindizierung bei AI Foundation Services aufnehmen, um Daten aus Diagrammen, Tabellen und Grafiken zu extrahieren.

Asynchronous Requests (Queue API) Lang laufende oder Batch-Inferenzaufträge an die Queue API von AI Foundation Services übergeben und die Ergebnisse asynchron abfragen.

Anleitungen

Kern-API

Multimodal & Medien

Erweitert

GLM‑5.2