STACKIT als redundante Infrastruktur Disaster Recovery in der europäischen Cloud

Grafik: Mann steht vor einem visuellen Bücherregal mit Datenbanken

Um die Verfügbarkeit der internen IT-Services auch im Ernstfall sicherzustellen, hat das interne Managed Services-Team von inovex (iMS) eine Disaster-Recovery-Strategie auf Basis von STACKIT entworfen. Durch die Nutzung der europäischen Cloud-Alternative soll nicht nur die Resilienz der Systeme erhöht, sondern auch die digitale Souveränität von inovex gestärkt werden.

Der Hintergrund: Die inovex Cloud Server (iCS)

Die interne IT-Infrastruktur von inovex bildet das Rückgrat für die tägliche Arbeit der Mitarbeitenden. Ein internes Team betreibt hierfür die „inovex Cloud Services“ (iCS) – eine Private Cloud auf Basis von OpenStack, die auf dedizierter Hardware in einem Rechenzentrum in Frankfurt läuft. Über 60 bis 70 interne Services werden hier gehostet. Mit diesem Setup ist inovex weitestgehend unabhängig. Wie bei jeder On-Premise- oder Private-Cloud-Lösung gibt es ein zentrales Risiko: Fällt die Infrastruktur physisch oder logisch komplett aus, stehen die Services still. Um die Verfügbarkeit sicherzustellen, wurden die Daten in der Vergangenheit zwar im Rahmen eines mehrstufigen Backup-Konzeptes in andere Rechenzentren gespiegelt, jedoch fehlten die Compute-Kapazitäten für eine schnelle Wiederherstellung. Bisher reichten die vorhandenen Maßnahmen im Rahmen der inovex Restore Time Objectives (RTO) aus. Um diese Zielvorgaben aber deutlich unterschreiten zu können, mussten das Konzept und die technologische Basis grundlegend überarbeitet werden.

Die Herausforderung: Resilienz durch einen zweiten Standort

Die Grundüberlegung der iCS und iMS-Teams war klar: Für den unwahrscheinlichen Fall, dass die iCS nicht erreichbar ist oder technische Probleme hat, wird ein zuverlässiges Backup- und Restore- benötigt (Disaster Recovery) ohne in den Invest einer eigenen, dauerhaft verfügbaren Standby Infrastruktur mit entsprechender Kapazität gehen zu müssen.

Gesucht wurde ein Cloud-Provider, der folgende Kriterien erfüllt:

Storage

Ausreichende, flexibel abrufbare Compute- und Storage-Kapazitäten, um neben den regulären Backups und geo-redundanten Services im Disaster Fall auch die gesamte inovex Workload betreiben zu können.

Kompatibilität

Da die iCS auf OpenStack basiert, sollte auch das Zielsystem idealerweise OpenStack-basiert sein oder zumindest ein ähnliches, kompatibles Konzept bieten, um Migrationen und Backup-Restores zu vereinfachen.

Datensouveränität

Als deutsches Unternehmen legt inovex Wert auf Datenschutz und DSGVO-Compliance.

Managed Services

Um den administrativen Aufwand für das interne Team gering zu halten, sollte Managed Kubernetes (K8s) verfügbar sein.

Die Entscheidung für STACKIT

Die Wahl fiel auf den Technologie-Partner STACKIT. Neben der bestehenden Partnerschaft überzeugte STACKIT vor allem durch die technologische Nähe (OpenStack-Basis), den Standort Deutschland/Europa und die verfügbaren Services.

Während der Evaluierungsphase testete das Team verschiedene Services, darunter Block Storage, Object Storage und das Managed-Kubernetes-Angebot von STACKIT. Besonders positiv fiel dabei die rasante Entwicklungsgeschwindigkeit des Portfolios auf. Während beispielsweise die CLI (Command Line Interface) zum Teil noch Beta-Status hatte, entwickelte sie sich innerhalb eines Jahres zu einem ausgereiften Tool weiter. Auch der Support erwies sich als schnell und kompetent.

Die Lösung: Integration von STACKIT Kubernetes Engine (SKE)

Das Team iMS baute eine vollständige Kubernetes-Infrastruktur auf Basis der STACKIT Kubernetes Engine (SKE) auf. Das Ziel war es, eine Umgebung zu schaffen, die über die gleichen Features verfügt wie die internen Cluster auf der iCS.

Ein wesentlicher Vorteil von SKE war der deutlich geringere Aufwand im Vergleich zu einem selbst verwalteten Kubernetes-Cluster.

Das Ergebnis: Erste Erfolge im Live-Betrieb

Obwohl das Projekt noch nicht abgeschlossen ist, hat sich die Lösung bereits in der Praxis bewährt.

Proof of Concept

Backups der internen Systeme ließen sich in der STACKIT-Umgebung sofort und ohne Komplikationen wiederherstellen.

Ernstfallerprobung

Als es zu einer temporären Störung der iCS kam, wurden die GitLab Runner (essenziell für CI/CD-Pipelines) kurzfristig auf die STACKIT-Infrastruktur geschwenkt. Dieser Notbetrieb funktionierte reibungslos und bestätigte die Einsatzfähigkeit der Disaster-Recovery-Strategie.

VPN-Integration

Eine zukünftige VPN-Lösung läuft bereits im semiproduktiven Betrieb auf der neuen Plattform und integriert diese nahtlos in das unternehmensweite Netzwerk.

Ausblick

Zukünftig wird STACKIT fester Bestandteil der inovex-Infrastruktur, um bei Störungen der iCS zeitnah und unabhängig Services starten zu können. Besonders kritische Services sollen künftig redundant auf beiden Infrastrukturen laufen, um eine noch höhere Verfügbarkeit und Unabhängigkeit zu garantieren. Zudem ermöglicht die Integration inovex, flexibel auf die „as a Service“-Features von STACKIT zuzugreifen, ohne diese selbst entwickeln zu müssen.

Foto von Yaren Sahin, Sales

🗓️ Termine frei
Buchen Sie Ihr Erstgespräch – unverbindlich und kostenfrei.

Zurück
Foto von Yaren Sahin, Sales

Ich freue mich auf Ihre Anfrage.

Yaren Sahin

Wie steht es um Ihre Digitale Souveränität?

Buchen Sie jetzt Ihre kostenlose Erstberatung mit unseren Expert:innen und machen Sie den ersten Schritt zu mehr digitaler Unabhängigkeit.

Termin buchen
Schwarz-weiß Bild von Sören König
Sören König
Digital Sovereignty Strategist und Cloud Platform Engineer
Foto von Yaren Sahin, Sales
Yaren Sahin
Account Manager New Business