DSGVO-konforme KI-Lösungen über API. Hosting in Deutschland mit transparenten Trainingsdaten.
curl https://api.cervus-it.de/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "olmo-3.1-32b-instruct",
"messages": [{
"role": "user",
"content": "Hallo Cervus KI!"
}]
}'Enterprise-Power mit maximaler Transparenz
Ihre Daten existieren nur für Millisekunden im RAM. Keine Logs, kein Training-Loop.
zero_retention = trueVollständig kompatibel mit dem OpenAI-API-Standard. Einfacher Wechsel möglich.
base_url: "api.cervus-it.de"ISO-zertifizierte Rechenzentren in Bayern. Ihre Daten bleiben in Deutschland.
region: "de-bavaria"Bis zu 100 DIN-A4-Seiten gleichzeitig verarbeiten. Massive Dokumente in einem Request.
max_tokens: 65536Transparente Trainingsdaten (Dolma 3), Apache 2.0 Lizenz. Rechtssicher für Enterprise.
model: "olmo-3.1-32b-instruct"Fehlerfreies Function Calling und Reasoning Mode für logische Analysen.
tools: ["function_calling"]Integration in 10 Sekunden
Erstellen Sie Chat-Completions mit dem Olmo 3.1 Modell.
curl https://api.cervus-it.de/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "olmo-3.1-32b-instruct",
"messages": [{
"role": "user",
"content": "Hallo Cervus KI!"
}]
}'{
"id": "chatcmpl-...",
"object": "chat.completion",
"created": 1234567890,
"model": "olmo-3.1-32b-instruct",
"choices": [{
"index": 0,
"message": {
"role": "assistant",
"content": "Hallo! Wie kann ich Ihnen helfen?"
},
"finish_reason": "stop"
}],
"usage": {
"prompt_tokens": 10,
"completion_tokens": 8,
"total_tokens": 18
}
}Nahtlose Einbindung in Ihre Workflows
Tauschen Sie einfach die base_url in Ihrer n8n-Instanz aus.
base_url: "https://api.cervus-it.de"
api_key: "YOUR_API_KEY"Verwenden Sie den OpenAI-Modul mit unserer API-URL.
endpoint: "api.cervus-it.de"
model: "olmo-3.1-32b-instruct"Wählen Sie die passende Infrastruktur für Ihre KI-Strategie. DSGVO-konform, stateless und in Bayern gehostet.
Ideal für Prototyping und kleine Automatisierungen.
Modell
Olmo 3.1 7B
Tokens
5 Mio. / Monat
Context
8k Window
Hosting
Bayern (ISO)
Maximale Performance für produktive Enterprise-Workflows.
Modell
Olmo 3.1 32B Instruct
Tokens
25 Mio. / Monat
Context
65k (Enterprise)
Architecture
Stateless API
Dedizierte Cluster und individuelle SLAs für Großprojekte.
Modell
Custom Cluster
Tokens
80 Mio.+ / Monat
Context
65k+ (SLA)
Hosting
Bayern (Dediziert)