Subscribe to receive emails everytime Schulungstool Status publishes an update.
By subscribing to status updates you agree to Privacy policy and Terms of Service.
Zusammenfassung:
- Beginn: 11.07.2025, 15:29 Uhr (UTC+2)
- Ende: 11.07.2025, 17:13 Uhr
- Dauer: 1 Stunde 44 Minuten
- Betroffen: Schulungstool-Konten komplett nicht erreichbar
Was ist passiert?
Eine Netzwerkstörung bei unserem Provider Hetzner führte zum Ausfall unseres Redis-Servers, der für alle Benutzersitzungen essentiell ist. Dadurch war die gesamte Webanwendung nicht nutzbar. Hintergrundprozesse wie der Versand von E-Mail-Berichten liefen weiterhin.
Timeline:
- 15:29 Uhr: Störungsbeginn
- 15:34 Uhr: Problemidentifikation gestartet
- 15:40 Uhr: Problem identifiziert, Lösung gestartet
- 15:45 Uhr: Status-Eintrag auf status.schulungstool.de veröffentlicht
- 15:55 Uhr: Server aus Backup wiederhergestellt
- 16:00 Uhr: Konfigurationsänderungen eingeleitet
- 16:36 Uhr: Verzögerung durch manuelle Firewall-Anpassungen
- 16:45 Uhr: Weitere Verzögerungen aufgrund verzögerter Netzwerkinfrastruktur
- 17:13 Uhr: Vollständige Wiederherstellung
Warum hat es so lange gedauert?
Die Wiederherstellung verzögerte sich durch:
- Langsame Reaktion der Hetzner-Infrastruktur
- Notwendige manuelle Firewall-Konfigurationen
- Erforderlicher Neustart aller App-Server
Unsere Maßnahmen:
- Sofort: Fehleranalyse und -dokumentation
- Kurzfristig: Evaluierung der gesamten Infrastruktur-Architektur auf Single Points of Failures
- Mittelfristig: Implementierung einer redundanten Redis-Cluster-Lösung, Verbesserung der Failover-Mechanismen
- Langfristig: Eliminierung der gesamten Infrastruktur-Architektur auf Single Points of Failures
Entschuldigung:
Dies war unser mit Abstand längster Ausfall überhaupt. Normalerweise beheben wir Störungen, die ohnehin nur sehr selten auftreten, innerhalb von 30 Minuten. Wir entschuldigen uns für die Unannehmlichkeiten und arbeiten daran, dass sich dies nicht wiederholt.
Bei Fragen: support@schulungstool.de