API v1.0

Cervus
KI

DSGVO-konforme KI-Lösungen über API. Hosting in Deutschland mit transparenten Trainingsdaten.

API-Key anfordern
api.cervus-it.de
curl https://api.cervus-it.de/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "olmo-3.1-32b-instruct",
    "messages": [{
      "role": "user",
      "content": "Hallo Cervus KI!"
    }]
  }'

Features

Enterprise-Power mit maximaler Transparenz

Stateless Architecture

Ihre Daten existieren nur für Millisekunden im RAM. Keine Logs, kein Training-Loop.

zero_retention = true

OpenAI Compatible

Vollständig kompatibel mit dem OpenAI-API-Standard. Einfacher Wechsel möglich.

base_url: "api.cervus-it.de"

Hosting in Deutschland

ISO-zertifizierte Rechenzentren in Bayern. Ihre Daten bleiben in Deutschland.

region: "de-bavaria"

65k Context Window

Bis zu 100 DIN-A4-Seiten gleichzeitig verarbeiten. Massive Dokumente in einem Request.

max_tokens: 65536

Olmo 3.1 32B

Transparente Trainingsdaten (Dolma 3), Apache 2.0 Lizenz. Rechtssicher für Enterprise.

model: "olmo-3.1-32b-instruct"

Native Tool Use

Fehlerfreies Function Calling und Reasoning Mode für logische Analysen.

tools: ["function_calling"]

API-Dokumentation

Integration in 10 Sekunden

POST/v1/chat/completions

Erstellen Sie Chat-Completions mit dem Olmo 3.1 Modell.

Request
curl https://api.cervus-it.de/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "olmo-3.1-32b-instruct",
    "messages": [{
      "role": "user",
      "content": "Hallo Cervus KI!"
    }]
  }'
Response
{
  "id": "chatcmpl-...",
  "object": "chat.completion",
  "created": 1234567890,
  "model": "olmo-3.1-32b-instruct",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "Hallo! Wie kann ich Ihnen helfen?"
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 8,
    "total_tokens": 18
  }
}

Integration

Nahtlose Einbindung in Ihre Workflows

n8n

Tauschen Sie einfach die base_url in Ihrer n8n-Instanz aus.

base_url: "https://api.cervus-it.de" api_key: "YOUR_API_KEY"

Make (Integromat)

Verwenden Sie den OpenAI-Modul mit unserer API-URL.

endpoint: "api.cervus-it.de" model: "olmo-3.1-32b-instruct"

Einfache Tarife, volle Souveränität

Wählen Sie die passende Infrastruktur für Ihre KI-Strategie. DSGVO-konform, stateless und in Bayern gehostet.

v1.1ID: starter

STARTER

Ideal für Prototyping und kleine Automatisierungen.

149 €/Monat

Modell

Olmo 3.1 7B

Tokens

5 Mio. / Monat

Context

8k Window

Hosting

Bayern (ISO)

Anfragen
Most Popular
v1.1ID: business

BUSINESS

Maximale Performance für produktive Enterprise-Workflows.

399 €/Monat

Modell

Olmo 3.1 32B Instruct

Tokens

25 Mio. / Monat

Context

65k (Enterprise)

Architecture

Stateless API

Jetzt Starten
v2.0ID: partner

PARTNER

Dedizierte Cluster und individuelle SLAs für Großprojekte.

Nach Vereinbarung

Modell

Custom Cluster

Tokens

80 Mio.+ / Monat

Context

65k+ (SLA)

Hosting

Bayern (Dediziert)

Kontakt
NO_TRAININGSTATELESS_APIBAVARIA_HOSTEDGDPR_LOCKED