Golang Logo

Go/Golang Training

Unser Hands-On-Einstieg in die Entwicklung mit Go. Nächster Termin: 14.- 15.05. in Köln – jetzt buchen!
Zum Training 
Zwei Männer arbeiten am Schreibtisch

ProSiebenSat.1:
Entwicklung einer Big-Data- und Data-Science-Lösung

Welchen messbaren Einfluss hat TV-Werbung auf das Online-Verhalten? inovex und ProSiebenSat.1 beantworten diese Frage objektiv mit Big-Data-Technologien und gaben mit einem Vortrag beim BITKOM Big Data Summit 2015 spannende Einblicke in das Projekt.

ProSieben Media SE Logo

Die ProSiebenSat.1 Media AG vermarktet einerseits klassische TV-Werbezeiten und beteiligt sich andererseits an zahlreichen E-Commerce-Unternehmen. Im Rahmen der Beteiligung stellt ProSiebenSat.1 u. a. Werbezeiten für die Bewerbung der E-Commerce-Angebote zur Verfügung. Es ist daher von hohem Interesse für ProSiebenSat.1, welchen konkreten Beitrag die TV-Werbung zur Wertschöpfung des beworbenen E-Commerce-Unternehmens leistet. Wie viele Visitors besuchen genau deshalb die E-Commerce-Website, weil sie die TV-Werbung gesehen haben? Und welchen Umsatz bringen diese Visitors, die nachweislich ursächlich wegen der TV-Werbung auf die Website gekommen sind?

Die Herausforderung

Standard-Lösungen für die Analyse von Web-Traffic können den Zusammenhang zwischen TV-Spot-Ausstrahlungen, also Ereignissen außerhalb der Online-Welt, und dem dadurch ausgelösten Online-Verhalten nicht klären. Deshalb hat ProSiebenSat.1 sich für die Entwicklung einer individuellen Big-Data-Lösung zur Klärung dieser Fragen entschieden.

Die Lösung

Das Hadoop-Cluster mit den gesammelten Traffic-Daten stand zum Start der Lösungsentwicklung bereits zur Verfügung, als Ergebnis eines vorgelagerten Projekts, das die inovex GmbH für die ProSie-benSat.1 Media AG realisiert hat. Durch den Big Data-Ansatz konnte ein Verfahren entwickelt werden, um den TV-Einfluss auf den Website-Traffic zu messen. Die Lösung wird in einer ersten Ausbaustufe bereits produktiv betrieben. In einer Proof-of-Concept-Phase werden derzeit weitere Ausbaustufen entwickelt.

Big Data

Es handelt sich bei dem Einsatzszenario um ein Data-Science-Projekt auf der Grundlage eines Hadoop-Clusters, das die inovex GmbH für die ProSiebenSat.1 AG umgesetzt hat. Im Kern geht es um die Frage, welchen exakten, objektiv messbaren Effekt die Ausstrahlung von TV-Spots für E-Commerce-Angebote auf den Traffic eben dieser E-Commerce-Sites hat und welcher Umsatz am Ende mit diesen »spotindu-zierten« Visitors gemacht wird.

Dazu werden Traffic-Daten herangezogen, die sich über einen Betrachtungszeitraum von mehreren Jahren erstrecken können, und mit den Informationen über die Spot-Ausstrahlungen in diesem Zeitraum in Beziehung gesetzt. Diese Korrelation wird bislang von keinem klassischen Web-Traffic-Analyse-System unterstützt, weil die Log-Daten und die TV-Spot-Daten heterogene Formate aufweisen (Variety).

Mit der individuell entwickelten Data-Science-Lösung, die täglich rund 60 Millionen Visits analysiert (Volume/Velocity), kann ProSiebenSat.1 den wirtschaftlichen Nutzen von TV-Spots für die Bewerbung digitaler Geschäftsmodelle nachweisen und präzise berechnen.
Außerdem kann ProSiebenSat.1 valide Aussagen über die Effizienz von TV-Spot-Typen treffen (Sender, Spot-Länge, Zeitpunkt der Ausstrahlung etc.) und die Wirkung der Spots für zukünftige Ausstrahlungen vorhersagen.
Während der Entwicklungsphase sind unter anderem Data-Science-Algorithmen aus dem Bereich der multivariaten Verfahren verwendet worden, die bereits am CERN bei der Suche nach dem Higgs-Boson eingesetzt worden sind.

Methodische Details

Grafische Darstellung der Spot-Induktion
Abbildung: Spot-Induktion

Die Spot-Induktion bewertet über eine Mengen betrachtung, ob ein Visit einem TV-Spot zugeschrieben werden kann. Hierzu wird die Synchronität beider Ereignisse in verschiedenen Kategorien (Visit-Einstieg, Endgerät etc.) untersucht. Ausgehend vom Baseline-Traffic (gemessen acht Minuten vor der Spot-Ausstrahlung) werden im Signalfenster (acht Minuten nach der Spot-Ausstrahlung) inkrementelle Visits oberhalb dieser Baseline dem Spot zugeordnet. Über die relative Gewichtung von TV-Spots können überlappende Signalregionen aufgelöst werden. Der Algorithmus ist als Hive UDTF implementiert.

Die kurzreichweitigen Ergebnisse der Spot-Induktion definieren die Grundlage für den MVA-Ansatz zur Messung des langreichweitigen TV-Effekts (siehe Abbildung „Revenue-Analyse“).

Grafische Darstellung der Umsatzanalyse
Abbildung: Revenue-Analyse

Innovation

Nach aktuellem Kenntnisstand markiert ProSiebenSat.1 mit diesem Projekt, das erstmalig die fehlende Verbindung zwischen der Online- und der TV-Wirkungsanalyse herstellt, eine Pionierleistung in der Big-Data-gestützten Werbewirkungsforschung. Es sind noch keine anderen vergleichbaren Implementierungen in der Medien-Branche publiziert worden.

Nutzen

Der Nutzen der Big-Data-Lösung besteht in folgenden Komponenten:

  • Expliziter, messbarer Nachweis des wirtschaftlichen Nutzens von ausgestrahlter TV-Werbung für die Bewerbung von E-Commerce-Angeboten,
  • Ableitung von Vorhersagen für die Effizienz von geplanter TV-Werbung,
  • Optimierung der Media-Planung für TV-Werbung,
  • maximal effizienter Einsatz des Marketing-Budgets.

Ausblick

Folgende nächste Schritte beim Big Data-Einsatz sind vorgesehen:

  • Weitere Verfeinerung der Data-Science-Methoden, z. B. für die Wirtschaftlichkeitsberechnung,
  • Anbindung weiterer Datenquellen zur besseren Modellierung des Nutzerverhaltens,
  • Anbindung weiterer Websites.
Technologie-Stack
  • Cloudera CDH
  • Hive
  • Hive-BO-Interface

Wie können wir Sie unterstützen?

Florian Wilhelm

Head of Data Science, Ansprechperson Data Management & Analytics