Decision Guide
On-Prem oder Cloud KI? Der Schweizer KMU-Entscheidungs-Guide
Drei Kriterien entscheiden: Datensensitivität, Team-Grösse, Anschaffungsbudget. Ehrlich, ohne Tech-Verkaufs-Bias.
Die zwei Welten
Cloud-KI: ChatGPT Enterprise, Microsoft Copilot, Claude Enterprise, Google Gemini Enterprise. Schnell eingeführt, niedriger Initial-Aufwand. Aber: Deine Daten verlassen den Betrieb, oft über US-Server. Lizenz-Kosten pro Nutzer pro Monat. revDSG-Konformität nur über DPA-Vertrag.
On-Prem-KI: Lokales LLM auf eigener Hardware, etwa einer Lenovo ThinkStation PGX, mit Open-Source-Stack (Ollama + Open-WebUI), optional mit einem Orchestrierungs-Layer wie der Xinity Engine. Höhere Initial-Investition. Aber: Deine Daten bleiben im Haus, keine Per-User-Lizenzen, volle revDSG-Konformität strukturell statt vertraglich.
Kriterium 1: Datensensitivität
| Daten-Typ | Empfehlung |
|---|---|
| Generische Office-Inhalte (Mails, Standard-Dokumente) | Cloud |
| Personendaten in regulierten Branchen (Treuhand, Finanz, Gesundheit) | On-Prem (oder Cloud nur mit sehr striktem DPA) |
| IP-sensitiver Code | On-Prem |
| Mandanten-Schriftverkehr | On-Prem |
| Marketing-Content ohne Kundendaten | Cloud |
Kriterium 2: Team-Grösse + Nutzungs-Profil
| Team | Cloud-Lizenz / Monat (Beispiel) | On-Prem (einmalig) | Break-even |
|---|---|---|---|
| 5 User | ~CHF 300/Monat | Lenovo-Listenpreis + Aufbau | Nach 12–18 Monaten |
| 20 User | ~CHF 1’200/Monat | identisch | Nach 6–12 Monaten |
| 50 User | ~CHF 3’000/Monat | identisch | Nach 3–6 Monaten |
Hinweis: Cloud-Preise sind illustrativ basierend auf typischen ChatGPT-Enterprise-Lizenzkosten. Aktuelle Preise im Architektur-Gespräch.
Kriterium 3: Compliance- und Governance-Anforderungen
- Audit-Trail-Pflicht? → On-Prem strukturell einfacher (oder Cloud + Xinity-artige Orchestrierung)
- EU-AI-Act-Readiness? → On-Prem oder EU-souveräner Stack
- Betriebs-interne Vorgabe „Daten verlassen das Haus nicht"? → On-Prem, Punkt
- Keine speziellen Anforderungen? → Cloud reicht meistens
Hybride Architekturen sind die Regel
Das oben Geschriebene klingt nach „Entweder-oder". In der Praxis sind hybride Setups die Norm: Office-Workflows in Cloud-KI, sensible Workflows on-prem. Wir denken eine Architektur pro Use Case, nicht pro Unternehmen.
Wann Xinity ins Spiel kommt
Du willst nicht nur Schweizer Hardware, sondern auch einen EU-souveränen Software-Stack? Dann integrieren wir die Xinity Engine. Eine Wiener Open-Source-Orchestrierungs-Schicht (Apache 2.0) mit OpenAI-kompatibler API, Modell-Routing und Audit-Trails. Empfehlenswert für Multi-Team-Setups mit erhöhten Compliance-Anforderungen.
Der Schweizer Sonderfall: revDSG
Das revidierte Datenschutzgesetz, in Kraft seit 1. September 2023, verlangt bei Cloud-KI-Nutzung mit US-Anbietern einen Auftragsdatenverarbeitungs-Vertrag (DPA) und die Information der betroffenen Personen. On-Prem vermeidet dieses Thema strukturell komplett. Die Daten verlassen den Betrieb nicht.
Häufige Fragen
Ist Cloud-KI in der Schweiz illegal?
Nein. Mit DPA-Vertrag, Information der Betroffenen und Risiko-Abwägung ist Cloud-KI für viele Use-Cases revDSG-konform nutzbar. „Illegal" ist sie nicht.
Warum dann überhaupt on-prem?
Bei sensitiven Daten, IP, regulierten Branchen, Multi-Team-Setups oder interner Vorgabe „Daten bleiben im Haus" wird on-prem strukturell sicherer und ab gewisser Team-Grösse wirtschaftlicher.
Wie schnell läuft Cloud-KI vs On-Prem?
Cloud-Setup: 3–8 Tage. On-Prem mit ThinkStation: 2–6 Wochen inkl. Hardware-Lieferung. Zeitfaktor bevorzugt Cloud, Sensitivitätsfaktor on-prem.
Können wir später wechseln?
Ja, in beide Richtungen. Cloud → On-Prem ist häufiger, weil Datensensitivität typisch wächst, nicht schrumpft.
Was ist Xinity?
Wiener Open-Source-Orchestrierungs-Schicht für On-Prem-LLMs. OpenAI-kompatibel, Apache 2.0. Wir integrieren sie auf Wunsch.
Was empfiehlst du typischerweise?
Hybrid: Cloud für Office-Standard-Use-Cases, On-Prem für Sensitives. Die Frage ist nicht „on-prem oder Cloud", sondern „welche Use-Cases gehören wohin".