Decision Guide

On-Prem oder Cloud KI? Der Schweizer KMU-Entscheidungs-Guide

Drei Kriterien entscheiden: Datensensitivität, Team-Grösse, Anschaffungsbudget. Ehrlich, ohne Tech-Verkaufs-Bias.

Die zwei Welten

Cloud-KI: ChatGPT Enterprise, Microsoft Copilot, Claude Enterprise, Google Gemini Enterprise. Schnell eingeführt, niedriger Initial-Aufwand. Aber: Deine Daten verlassen den Betrieb, oft über US-Server. Lizenz-Kosten pro Nutzer pro Monat. revDSG-Konformität nur über DPA-Vertrag.

On-Prem-KI: Lokales LLM auf eigener Hardware, etwa einer Lenovo ThinkStation PGX, mit Open-Source-Stack (Ollama + Open-WebUI), optional mit einem Orchestrierungs-Layer wie der Xinity Engine. Höhere Initial-Investition. Aber: Deine Daten bleiben im Haus, keine Per-User-Lizenzen, volle revDSG-Konformität strukturell statt vertraglich.

Kriterium 1: Datensensitivität

Daten-TypEmpfehlung
Generische Office-Inhalte (Mails, Standard-Dokumente)Cloud
Personendaten in regulierten Branchen (Treuhand, Finanz, Gesundheit)On-Prem (oder Cloud nur mit sehr striktem DPA)
IP-sensitiver CodeOn-Prem
Mandanten-SchriftverkehrOn-Prem
Marketing-Content ohne KundendatenCloud

Kriterium 2: Team-Grösse + Nutzungs-Profil

TeamCloud-Lizenz / Monat (Beispiel)On-Prem (einmalig)Break-even
5 User~CHF 300/MonatLenovo-Listenpreis + AufbauNach 12–18 Monaten
20 User~CHF 1’200/MonatidentischNach 6–12 Monaten
50 User~CHF 3’000/MonatidentischNach 3–6 Monaten

Hinweis: Cloud-Preise sind illustrativ basierend auf typischen ChatGPT-Enterprise-Lizenzkosten. Aktuelle Preise im Architektur-Gespräch.

Kriterium 3: Compliance- und Governance-Anforderungen

  • Audit-Trail-Pflicht? → On-Prem strukturell einfacher (oder Cloud + Xinity-artige Orchestrierung)
  • EU-AI-Act-Readiness? → On-Prem oder EU-souveräner Stack
  • Betriebs-interne Vorgabe „Daten verlassen das Haus nicht"? → On-Prem, Punkt
  • Keine speziellen Anforderungen? → Cloud reicht meistens

Hybride Architekturen sind die Regel

Das oben Geschriebene klingt nach „Entweder-oder". In der Praxis sind hybride Setups die Norm: Office-Workflows in Cloud-KI, sensible Workflows on-prem. Wir denken eine Architektur pro Use Case, nicht pro Unternehmen.

Wann Xinity ins Spiel kommt

Du willst nicht nur Schweizer Hardware, sondern auch einen EU-souveränen Software-Stack? Dann integrieren wir die Xinity Engine. Eine Wiener Open-Source-Orchestrierungs-Schicht (Apache 2.0) mit OpenAI-kompatibler API, Modell-Routing und Audit-Trails. Empfehlenswert für Multi-Team-Setups mit erhöhten Compliance-Anforderungen.

Der Schweizer Sonderfall: revDSG

Das revidierte Datenschutzgesetz, in Kraft seit 1. September 2023, verlangt bei Cloud-KI-Nutzung mit US-Anbietern einen Auftragsdatenverarbeitungs-Vertrag (DPA) und die Information der betroffenen Personen. On-Prem vermeidet dieses Thema strukturell komplett. Die Daten verlassen den Betrieb nicht.

Häufige Fragen

Ist Cloud-KI in der Schweiz illegal?

Nein. Mit DPA-Vertrag, Information der Betroffenen und Risiko-Abwägung ist Cloud-KI für viele Use-Cases revDSG-konform nutzbar. „Illegal" ist sie nicht.

Warum dann überhaupt on-prem?

Bei sensitiven Daten, IP, regulierten Branchen, Multi-Team-Setups oder interner Vorgabe „Daten bleiben im Haus" wird on-prem strukturell sicherer und ab gewisser Team-Grösse wirtschaftlicher.

Wie schnell läuft Cloud-KI vs On-Prem?

Cloud-Setup: 3–8 Tage. On-Prem mit ThinkStation: 2–6 Wochen inkl. Hardware-Lieferung. Zeitfaktor bevorzugt Cloud, Sensitivitätsfaktor on-prem.

Können wir später wechseln?

Ja, in beide Richtungen. Cloud → On-Prem ist häufiger, weil Datensensitivität typisch wächst, nicht schrumpft.

Was ist Xinity?

Wiener Open-Source-Orchestrierungs-Schicht für On-Prem-LLMs. OpenAI-kompatibel, Apache 2.0. Wir integrieren sie auf Wunsch.

Was empfiehlst du typischerweise?

Hybrid: Cloud für Office-Standard-Use-Cases, On-Prem für Sensitives. Die Frage ist nicht „on-prem oder Cloud", sondern „welche Use-Cases gehören wohin".