Bei unserem Meetup zur Rolle von Recommender Systems im Omnichnannel-Marketing sind einige Fragen offen geblieben. Diese haben wir hier zusammengetragen und von unseren Expert:innen beantworten lassen.

Sind Recommender Systems nur etwas für große Unternehmen, weil sie komplex und damit aufwändig zu bauen sind oder auch etwas für KMUs ?

Nein, da Recommender nicht zwingend komplex sein müssen. Einfache Ansätze wie beispielsweise Collaborative Filtering (CF) sind domänenagnostisch und beruhen auf Interaktionsdaten zwischen Nutzern und Items, d.h. Clicks, Views, Purchases, etc. Indem diese Daten erfasst und gespeichert werden, lässt sich hiermit schon ein erster CF Algorithmus trainieren, der bereits für personalisierte Recommendations eingesetzt werden kann. Dies empfiehlt sich für den Anfang. Da aber CF auch Probleme wie etwa den Kaltstart hat, bietet es sich in einer anschließenden Phase an, das bestehende System zu erweitern, um Recommendations sowie ihre Coverage zu verbessern und auch weitere Ziele zu modellieren.

Besteht bei Recommender-Systemen nicht die Gefahr, dass man irgendwann vergisst, über den Tellerrand hinauszusehen und evtl. andere ebenfalls interessante Themen/Produkte/… gar nicht wahrnimmt? Wie wird hiermit umgegangen?

Die Gefahr besteht in der Tat. Hier sind zwei Probleme zu nennen: Zum einen das Long-Tail-Problem bzw. die Item-Coverage des Recommenders und zum anderen die Diversität der Recommendations. Ersteres behandelt den Anteil der Items (Produkte, Songs, o. Ä.) aus dem Gesamtbestand (Korpus), die als Recommendations ausgespielt werden (können). Hier gibt es einen sogenannten Popularitäts-Bias, d.h. Inhalte mit denen häufig interagiert wird, haben eine höhere Wahrscheinlichkeit vorgeschlagen zu werden. Dies lässt sich durch eine geeignete Problemmodellierung verhindern bzw. dämpfen. Auch die Diversität der Vorschläge lässt sich quantifizieren und so modellieren, dass sie als Nebenziel der Optimierung berücksichtigt wird. Beides Aspekte, die dieses Feld praktisch und theoretisch weiterhin spannend machen – daher an dieser Stelle auch zwei empfehlenswerte Publikationen zu diesem Problem:

Muss man bei der Erfassung von implizitem Feedback den Datenschutz berücksichtigen? Wie kommuniziert man das?

Definitiv. Wesentlich sind hier Einwilligung und Anonymisierung. Jedoch bin ich weder Datenschutz-Experte noch Jurist und kann und darf damit keine Beratung und Empfehlung hierzu geben. Erwähnenswert finde ich in diesem Zusammenhang jedoch den sog. Erwägungsgrund 71 der DSGVO sowie eine Publikation, die die Auswirkungen von Löschanfragen bei Nutzern für Collaborative Filtering berücksichtigt. Außerdem interessant ist auch die Keynote von Mireille Hildebrandt anlässlich der RecSys 2019:

Wie geht man mit selbsterfüllenden Prophezeiungen bei Recommendern um? Wie vermeidet man bei Nearest Neighbor Recommendations einen Bias?

Die zugrundeliegenden Daten haben in den allermeisten Fällen bereits einen Bias. Hierbei fallen zum Beispiel Selection- oder Popularity Biases auf. Eine etablierte Technik, um den Bias zu reduzieren ist zum Beispiel das Inverse Propensity Scoring, wobei vereinfacht gesagt Datenpunkte mit Bias korrigiert werden.

Kannst du nochmal auf die Vorteile des Deep-Learning-Ansatzes bei mobile.de eingehen? Warum kein CF?

Der Ansatz ist zum einen nichtlinear im Vergleich zur Matrixfaktorisierung zum Lösen von CF und eröffnet damit eine mächtigere Modellierung und damit eine bessere Genauigkeit. Zum anderen ist es ein hybrider Ansatz, der neben Interaktionsdaten auch Features zu Usern und Items berücksichtigt (siehe auch Content-Based Recommender Systems). Durch diese zusätzlichen Daten können Coverage und Relevanz zusätzlich erhöht werden.

Sind die Recommendations auf mobile.de Realtime oder werden diese periodisch vorberechnet?

Die Erzeugung der Recommendations erfolgt in Echtzeit.

Mehr zum Thema Omnichannel