Data Science to Production

Maschinen, Geräte, Unternehmen und Nutzer generieren immer größere Datenmengen.

Machine-Learning-Modelle, die auf Grundlage dieser Daten entstehen, können Unternehmen neue Geschäftsmöglichkeiten eröffnen. Doch erst mit der Übertragung in produktive Systeme lassen sich daraus realisierbare Mehrwerte generieren.

Data Science eröffnet Unternehmen eine Vielzahl an Möglichkeiten, ihr Business weiterzuentwickeln – sei es über Vorhersagen des zukünftigen Kaufverhaltens von Kund:innen oder mit Recommender-Programmen, die für mehr Umsatz sorgen. 

Um diese Möglichkeiten auszuschöpfen muss eine große Hürde genommen werden: Die häufig in einem spezifischen Vorgehensmodell und in statistisch orientierten Programmiersprachen entwickelten (Machine-Learning-)Modelle müssen in die Praxis umgesetzt werden (Data Science to Production) und dort überwacht und gepflegt werden (Data Science in Production).

Herausforderung Praxisbetrieb

Viele Data Scientists konzentrieren sich mit ihren Modellen auf Machbarkeitsfragen und die Exploration neuer Möglichkeiten. Die Exploration macht jedoch nur einen Teil eines Data-Science-Projektes aus. Die Übertragung in die Produktion sowie die Wartung stellen häufig eine noch größere Herausforderung dar.

Es fehlt häufig an Data-Engineering-Kompetenzen oder kommt zu Performance-Problemen. Bereits bei der Algorithmen-Auswahl sollte der spätere Praxisbetrieb berücksichtigt werden. Neben technischen Aspekten wie dem Speicherbedarf der Modelle oder Deployment-Optionen steigen im Praxisbetrieb häufig auch die Anforderungen an die Interpretierbarkeit der Modelle oder die Fähigkeit, Unsicherheiten zu quantifizieren.

Da sich die Live-Situation wesentlich von der Test-Situation in der Anfangsphase unterscheiden kann, ist eine Monitoring-Strategie der laufenden Modell-Performance notwendig. Zusätzlich muss die Nutzererfahrung berücksichtigt werden, wodurch sich die Anforderungen an die Stabilität von Modell-Vorhersagen und -Bewertungen vergrößern. Produktiv eingesetzte Modelle beeinflussen die „Umwelt” (z.B. das Nutzerverhalten) und damit Daten, die die Grundlage für zukünftige Iterationen sind. Derartige Rückkopplungseffekte sind weitere Herausforderungen im Praxisbetrieb langlebiger Data-Science-Produkte.

Der Übergang in den produktiven Betrieb und die anschließende Wartung benötigen daher Expert:innen mit Erfahrung in gesamtheitlichen Data-Science-Projekten. So kann das in der ersten Phase entstandene, wertvolle Wissen auch in einen Mehrwert für das Business umgewandelt werden.

Data-Science-Lösung nach Maß

Wir sind durch unsere erfahrenen Data Scientists sowie Cloud, IT und Data Engineers in der Lage, Sie an jedem Punkt ihres Projekts zu unterstützen und weiterzubringen. Durch unsere fachübergreifende Expertise bieten wir Ihnen individuell auf Ihre Bedürfnisse zugeschnittene Lösungen. 

Unsere Teams decken den gesamten Lifecycle eines Data-Science-Projekts ab. Wir können Sie von der Datenanalyse über die Exploration und das Modelling bis in ein Produktivsystem und dessen fortlaufenden Betrieb mit unseren Expert:innen begleiten und bei der Organisation und Optimierung des Data Science Lifecycles unterstützen.

Langjährige Expertise

Durch unsere lange Unternehmensgeschichte, gehören wir zu den Big-Data-Pionieren Deutschlands und haben industrieübergreifend Erfahrung in Data-Science-Projekten gesammelt und Data-Engineering-Wissen aufgebaut. 

Seit vielen Jahren bauen wir moderne IT-Infrastrukturen für diese Art von Datenlösungen auf und unterstützen mit unseren Expert:innen aus einer Hand auch den laufenden DevOps bzw. MLOps-Betrieb.

Auf all diesen Kompetenzen baut unser großes Team von Data Scientists auf, das sich darauf verlassen kann, dass die entwickelten Modelle auch live gehen.

Entwicklung einer Big-Data- und Data-Science-Lösung für ProSiebenSat.1

Entwicklung einer Big-Data- und Data-Science-Lösung für ProSiebenSat.1

Für ProSiebenSat.1 ist es von großem Interesse, welchen konkreten Beitrag die TV-Werbung zur Wertschöpfung des beworbenen E-Commerce-Unternehmens leistet. Wie viele Visitors besuchen genau deshalb die E-Commerce-Website, weil sie die TV-Werbung gesehen haben? Und welchen Umsatz bringen diese Visitors, die nachweislich ursächlich wegen der TV-Werbung auf die Website gekommen sind? Die Herausforderung Standard-Lösungen für die Analyse von Web-Traffic können den Zusammenhang zwischen TV-Spot-Ausstrahlungen, also Ereignissen außerhalb der Online-Welt, und dem dadurch ausgelösten Online-Verhalten nicht klären. Deshalb hat ProSiebenSat.1 sich für die Entwicklung einer individuellen Big-Data-Lösung zur Klärung dieser Fragen entschieden. inovex hat für die ProSiebenSat.1 AG ein Data-Science-Projekt auf der Grundlage eines Hadoop-Clusters umgesetzt.

Case Study "Data Science für ProSiebenSat.1" jetzt lesen

Wie können wir Sie unterstützen?

Nehmen Sie mit uns Kontakt auf – einfach per Telefon oder E-Mail.

Wir freuen uns auf Ihre Nachricht!


Weitere Themen:

Stefan Igel

Ich freue mich auf Ihre Nachricht!

Stefan Igel

Führungsteam Data Management & Analytics

Projekt KOSMoS

Großes Gemeinschaftsprojekt: Smart-Contracting-Plattform

Viele Industrieunternehmen sammeln bereits vielfältige Daten, die ihre Produktionsanlagen ausgeben, und analysieren sie unternehmensintern. Anschließend können sie auf dieser Grundlage ihre eigene Produktion optimieren. Doch das Industrial Internet of Things (IIoT) bietet weitaus größere Potenziale. Das Projekt KOSMoS, das durch das Bundesministerium für Bildung und Forschung gefördert wird, verfolgt deshalb das Ziel, produzierende Unternehmen digital miteinander zu verbinden und damit ein Wertschöpfungsnetz über die Unternehmensgrenzen hinweg zu schaffen. Im Konsortium der neun Projektpartner ist inovex der Experte für Data Management und Analytics.

Zum Projekt KOSMoS

inovex Blog

F. Wilhelm

Data Science in Production: Packaging, Versioning and Continuous Integration

Blog-Artikel lesen

inovex Lab

Masterarbeit von S. Blank

Querying NoSQL with Deep Learning to Answer Natural Language Questions

Zur Masterarbeit

inovex Blog

M. Kurovski

From Exploration to Production—Bridging the Deployment Gap for Deep Learning

Blog-Artikel lesen