Anleitungen
Der Abschnitt „Anleitungen” beantwortet „Wie mache ich…”-Fragen. Jede Seite konzentriert sich auf eine einzelne Funktion: Sie zeigt den minimalen funktionsfähigen Code, erläutert die wichtigsten Parameter und weist auf plattformspezifisches Verhalten hin. Alle Beispiele verwenden die OpenAI-kompatible API, sodass vorhandener OpenAI-SDK-Code in der Regel mit einer einzeiligen Anpassung der Basis-URL funktioniert.
Wählen Sie unten ein Thema aus oder arbeiten Sie die Anleitungen der Reihe nach durch, wenn Sie neu bei AI Foundation Services sind.
Kern-API
Abschnitt betitelt „Kern-API“ Chat Completions Chat-Anfragen mit System- und Benutzernachrichten über die OpenAI-kompatible Chat-API von AI Foundation Services senden.
Streaming LLM-Antworten token-weise über Server-Sent Events streamen — für geringere Latenz und bessere Nutzererfahrung.
Embeddings Texteinbettungen für semantische Suche, Clustering und RAG-Anwendungen über die Embedding-API von AI Foundation Services generieren.
Function Calling Werkzeuge definieren und LLM-Hub-Modelle strukturierte JSON-Argumente zurückgeben lassen, um externe APIs und Datenquellen anzubinden.
Multimodal & Medien
Abschnitt betitelt „Multimodal & Medien“ Multimodal (Vision) Bilder zusammen mit Text über visionsfähige Modelle von AI Foundation Services mit der standardmäßigen Chat-Completions-API analysieren.
Audio (Sprache-zu-Text) Audiodateien mit Whisper-basierten Modellen von AI Foundation Services transkribieren und übersetzen, kompatibel mit der OpenAI Audio API.
Image Generation Bilder aus Textprompts über die OpenAI-kompatible Images-API von AI Foundation Services mit verfügbaren Bildmodellen generieren.
Erweitert
Abschnitt betitelt „Erweitert“ Reasoning Tiefe des Chain-of-Thought mit dem Parameter reasoning_effort bei unterstützten Modellen wie o1, Gemini 2.5 und Claude 4 steuern.
Visual RAG Dokumente mit kombinierter Text- und Bildindizierung bei AI Foundation Services aufnehmen, um Daten aus Diagrammen, Tabellen und Grafiken zu extrahieren.
Asynchronous Requests (Queue API) Lang laufende oder Batch-Inferenzaufträge an die Queue API von AI Foundation Services übergeben und die Ergebnisse asynchron abfragen.