Leistungsschein – STACKIT Model Serving

Service Name

STACKIT Model Serving

Kurzbeschreibung

Der STACKIT Model Serving Service („Model Serving„) stellt open-source Large-Language-Models (LLMs) und andere GenAI-Modelle als geteilte Instanzen bereit. Kunden können geteilte Instanzen über eine OpenAI-kompatible REST-API nutzen. Es werden u.a. Chat- und Embeddings-Modelle bereitgestellt. Zur Authentifizierung wird ein API-Schlüssel genutzt. Bei der Nutzung des Model Serving Services werden seitens STACKIT außer abrechnungsrelevanten Daten keinerlei Daten des Kunden erhoben oder ausgewertet.

Wesentliche Merkmale

Servicepläne

Jedes bereitgestellte Modell wird einem Serviceplan zugeordnet. Die Servicepläne werden nach aufsteigender Modelgröße in die Kategorien Base, Plus oder Premium eingeordnet. Die Zuordnung wird im STACKIT Portal sowie in der STACKIT Dokumentation beschrieben.

Metrik

Die Abrechnung des Model Serving erfolgt Token-basiert anhand des Typs des Modells:

SLA Spezifika

Abweichend von den Verfügbarkeitsangeben der allgemeinen STACKIT Servicebeschreibung wird für das Model Serving eine Verfügbarkeit von 99,5% im Kalendermonat (gemessen anhand der externen Erreichbarkeit der LLM-API) vereinbart.

Backup

Ein Backup der Anfragen des Kunden erfolgt nicht.

 Zusätzliche Bedingungen

Version und Geltungsbeginn

Version 1.0, gültig ab 04.02.2025