REWE digital:
Demand Forecasting für den REWE-Lieferservice

REWE und inovex treiben seit 2015 gemeinsam verschiedene Big-Data-Initiativen voran, um die Supply Chain der Einzelhandelskette weiter zu optimieren.Dazu zählen Trainings sowie die Einführung von Data Science und Big-Data-Technologien – inklusive der Entwicklung darauf aufbauender Anwendungen.

Logo von Rewe

Besonders intensiv hat inovex im Bereich der Supply-Chain-Optimierung mit der REWE-IT-Tochter REWE digital zusammengearbeitet. Bei REWE digital werden alle strategischen Online-Aktivitäten der REWE Group gebündelt.

Im Rahmen des aktuellen Projektes wurde die Absatzprognose (Demand Forecasting) für den REWE-Lieferservice neu entwickelt. Die Implementierung der Lösung sollte mit Hilfe von Big-Data-Technologien eine einfache Skalierbarkeit ermöglichen.

Kostenoptimaler Trade-off zwischen Verfügbarkeit und Abschriften

Die Kernaufgabe eines jeden Händlers ist es, optimal auf seine Kundschaft zugeschnittene Lieferketten zu betreiben und sie stetig an den sich ändernden Kundenwunsch anzupassen. Zwei maßgebliche Kennzahlen für die Qualitätsmessung der Bestandsplanung sind dabei die Verfügbarkeitsquote und die Abschriftenquote. Sie messen, ob eine Prognose zu hoch war und die Kunden weniger gekauft haben als prognostiziert (Überdeckung des Lagerbestands) oder ob sie zu niedrig war und somit die Waren ausverkauft waren, bevor die komplette Nachfrage bedient wurde (Unterdeckung des Lagerbestands). Beide Situationen erzeugen Kosten für den Händler und stellen einen Trade-Off dar. Ziel des Demand Forecastings ist es, diese Kosten in Summe zu minimieren.

Online-Handel vs. stationärer Handel

Im Fall des REWE-Lieferdienstes gibt es hinsichtlich des Demand Forecastings einige Besonderheiten zu beachten, da die Kundschaft ihren Einkauf mittels Online-Bestellung abwickelt. Bestellungen auf der Shop-Seite werden immer für die Zukunft abgegeben. Einkaufende geben im Voraus eine Bestellung ab und wählen einen (späteren) Zeitpunkt für den gewünschten Liefertermin. Auch wenn die meisten Aufträge kurzfristig für eine Zustellung in den nächsten drei Tagen erteilt werden, hat der Online-Händler einen entscheidenden Vorteil gegenüber dem stationären Handel: Er kennt bereits einen Teil der zukünftigen Nachfrage.

Zudem lässt sich im Online-Geschäft mehr über den Kundenwunsch erfahren als im stationären Markt. Der ursprüngliche Warenkorb der Einkäufer:innen gibt Auskunft über ihre wahren Wünsche – auch wenn sie schließlich wegen mangelnder Verfügbarkeit einzelner Artikel noch einmal ihren Warenkorb im Checkout anpassen. Da diese Information im stationären Markt nur schwer zu erhalten ist, sind sogenannte Out-of-Stock-Situationen offline nur schwer identifizierbar.

Auf beide Besonderheiten wurde bei der Konzeptionierung der Prognose-Modelle Rücksicht genommen. Dadurch erreicht REWE vergleichsweise präzise Prognosen zum zukünftigen Warenabsatz.

Dynamische und vollautomatisierte Prognose-Modelle

Das REWE-Produktsortiment ist mit ca. 30.000 Artikeln in einem Vollsortiment-Markt sehr umfangreich. Das Sortiment der Lieferlager ist demgegenüber zwar leicht eingeschränkt, enthält jedoch sämtliche bei REWE üblichen Produktgruppen. Damit bedient auch der Lieferdienst den für Einzelhändler typischen Long-Tail des Artikelabverkaufs. Ein relativ kleiner Anteil der Artikel wird sehr häufig nachgefragt, während ein großer Teil des Sortiments moderat bis wenig Nachfrage erfährt. Des Weiteren unterscheiden sich Artikel stark in ihrem Abverkaufsverhalten. Das Abverkaufsniveau, Saisonalität, Trends und andere Einflussfaktoren, wie z. B. Preis und Werbung, spielen dabei eine wesentliche Rolle.

Grafische Darstellung der Absatzverläufe

Bei diesen Unterschieden lässt sich erahnen, dass ein einheitliches Prognosemodell für alle Artikel wenig Sinn macht. Diese mit Hilfe statistischer Verfahren belegte Hypothese hat zur Entwicklung einer ganzen Reihe von sehr unterschiedlichen Modellen geführt. Diese Modelle werden nun dynamisch und vollautomatisiert den Artikeln so zugeordnet, dass REWE individuell eine maximale Prognosegüte erreicht.

Um den Trade-off zwischen Über- und Unterdeckungskosten optimal zu steuern, können die Prognosemodelle ein beliebiges Zielquantil schätzen. Dieses Zielquantil entspricht dem Service-Level der REWE gegenüber dem Kunden, also der Wahrscheinlichkeit, dass ein Kunde vor einem leeren Regal steht, der Artikel also in eine Out-of-Stock-Situation gerät.

Technologie-Stack

Technologisch wurde das neue Demand Forecasting auf Basis moderner verteilter Systeme mittels Apache Spark in Kombination mit Scikit-Learn und Pandas implementiert. Die Nutzung von Spark ermöglicht und garantiert die annähernd lineare Skalierung des Systems, wenn neue Lieferlager oder Artikel im Sortiment hinzugefügt werden. Scikit-Learn in Kombination mit Pandas – dem aktuellen Standard unter den Python-Bibliotheken für maschinelle Lernalgorithmen – wurde sowohl im Prototyping als auch in der produktiven Implementierung eingesetzt. Die Überführung eines Prototyps in die Produktion war somit einfach, da kein sogenannter Language Gap überwunden werden musste. PySpark sorgt für die Interoperabilität zwischen Spark und dem Python Stack.

Neben diesen zentralen Werkzeugen wurden noch eine Reihe weiterer Komponenten aus der Open-Source-Gemeinde verwendet.

Agile Umsetzung

Das Projekt wurde agil mit dem Scrum-Framework als Organisationsmodell entwickelt. Dabei hat man sich der aktuellen Lösung in mehreren Iterationen angenähert. Insbesondere im Data-Science-Kontext ist die Komplexität der Lösung zu Beginn eines Projektes nur schwer einschätzbar.

Die Güte und damit die Nützlichkeit von Prognosemodellen sind erst dann messbar, wenn sie existieren. Daher war die agile Arbeitsweise aus unserer Sicht maßgeblich für die erfolgreiche Umsetzung.

Im Mittelpunkt des Projekts standen stets der Kundennutzen und eine einfach zu implementierende Lösung. Während des Projektverlaufs wurden nicht nur die Güte der Absatzprognosemodelle verbessert, sondern auch die Integration in die bestehende REWE-Systemlandschaft durchgeführt. Ebenso wurden manuelle Eingriffsmöglichkeiten und ein umfangreiches Monitoring zur Überwachung der Modelle und ihrer Prognosen entwickelt.

Das erste produktive Rollout fand in einem Lieferlager für ca. 50% des Artikelsortiments statt. In der Folgezeit wurden sukzessive die weiteren Lieferlager aufgeschaltet und die Sortimentsabdeckung auf mittlerweile mehr als 95% ausgebaut. Zum Umfang gehören sowohl Waren des täglichen Bedarfs als auch das Frischesortiment sowie Obst und Gemüse. Manuelle Eingriffe durch Filial- oder Logistikmitarbeiter in die Prognose sind nur noch in Ausnahmefällen nötig.

Die Qualität der neuen Prognose-Lösung wurde an den zuvor genannten Kennzahlen gemessen. Insbesondere die Verfügbarkeitsquote wurde dabei in den Vordergrund gestellt. Die Menge an nicht verfügbaren Artikeln konnte bei gleichbleibenden Abschriften mit Hilfe der neuen Prognose halbiert werden.

Verwendete Technologien

  • Zeppelin
  • Jupiter
  • Grafana
  • Prometheus
  • Java
  • Scikit-Learn
  • Python
  • R
  • Apache Spark
  • Apache Kafka
  • PySpark
  • Google Cloud Platform
  • hadoop

Wie können wir Sie unterstützen?

Stefan Igel

Führungsteam Data Management & Analytics