Data Science

Die digitale Transformation erzeugt in den Unternehmen immense Datenmengen mit einer sehr großen Datenvielfalt, die enorme Anforderungen an die Komplexität und die Skalierbarkeit der Analyse-Methoden stellen: „Data Science at Scale“. 

Um diese Anforderungen zu erfüllen, übertragen wir bewährte Analyse-Methoden aus der akademisch-wissenschaftlichen Welt oder aus anderen Bereichen auf die Unternehmenswelt. Mit maßgeschneiderten Algorithmen können so auch aus immensen Datenvolumina wertvolle Informationen und Wissen extrahiert werden. Ein Beispiel für diesen Transfer von der Wissenschaft in den Business-Kontext sind multivariate Verfahren: Dieselben Konzepte und Algorithmen, mit denen am CERN nach dem Higgs-Boson gesucht wurde, helfen nun bei der Analyse von sehr großen Web-Traffic-Daten bei ProSiebenSat.1. 

Interdisziplinäres Experten-Team

inovex hat seit einigen Jahren ein sehr vielseitiges Team von hochqualifizierten Data Scientists an Bord, die neueste Methoden der Daten-Analyse für den Einsatz bei unseren Kunden nutzbar machen. Sie bringen aus ihren spezifischen Domänen – wie Biologie, Mathematik, Physik, Linguistik und Informatik – hocheffiziente Algorithmen mit, aus denen sich unser breites Leistungsspektrum in den Anwendungsbereichen Predictive Analytics und Prescriptive Analytics zusammensetzt.

Integration von Data Science in Big-Data-Systeme

Durch die enge interdisziplinäre Zusammenarbeit mit unseren Big-Data-Experten steht bei der Auswahl und bei der Implementierung unserer Analysen stets auch die Skalierbarkeit und die Performance der Algorithmen im Fokus. Ausgereifte Konzepte für die Integration in eine Produktivumgebung und für die Wartbarkeit der Analyse sind entscheidende Erfolgsfaktoren unserer Lösungen.

Technologie-Stacks

  • Batch- und Stream-Analyse mit Apache Spark und Flink
  • Ad-hoc-Zugriff mit Apache Zeppelin und Jupyter
  • Deep Learning mit Google Tensorflow
  • Implementierung in Python, R, Java oder Scala

Fokus auf Open-Source-Technologien

Unser Data-Science-Team setzt auf etablierte Open-Source-Technologien wie die Machine Learning (ML) Library von Apache Spark oder Flink ML, welche sowohl eine performante Batch-Verarbeitung als auch komplexe Echtzeit-Analysen von Daten-Streams ermöglichen. Einen explorativen Ad-hoc-Zugriff bieten interaktive Notebooks wie Apache Zeppelin oder Jupyter. Vielseitige APIs erlauben, je nach Kundenwunsch, die Implementierung in Python, R, Java oder Scala. Zusätzlich verwenden wir spezialisierte Libraries wie lightFM, eine Python-Implementierung effizienter Recommendation-Algorithmen.

Durch diesen Ansatz decken wir alle gängigen Verfahren wie Regression, Decision Trees, Support Vector Machine und Neuronale Netze aus einer Hand ab. In unserer Research & Development Abteilung „inovex Lab“ widmen wir uns zudem aktuellen Themen wie Deep Learning mit Tensorflow von Google, um technologisch immer auf dem neuesten Stand zu bleiben.

Data Science at Scale

Mit unserem breiten Technologie-Stack und dem vielseitigen Domänenwissen unserer Experten bieten wir unseren Kunden ein umfassendes Angebot an „Data Science at Scale“ – von Clustering und Classification über Text Mining und Forecasts bis hin zu Recommendation und Fraud Detection. 

Entwicklung einer Big-Data- und Data-Science-Lösung für ProSiebenSat.1

Entwicklung einer Big-Data- und Data-Science-Lösung für ProSiebenSat.1

Für ProSiebenSat.1 ist es von großem Interesse, welchen konkreten Beitrag die TV-Werbung zur Wertschöpfung des beworbenen E-Commerce-Unternehmens leistet. Wie viele Visitors besuchen genau deshalb die E-Commerce-Website, weil sie die TV-Werbung gesehen haben? Und welchen Umsatz bringen diese Visitors, die nachweislich ursächlich wegen der TV-Werbung auf die Website gekommen sind? Die Herausforderung Standard-Lösungen für die Analyse von Web-Traffic können den Zusammenhang zwischen TV-Spot-Ausstrahlungen, also Ereignissen außerhalb der Online-Welt, und dem dadurch ausgelösten Online-Verhalten nicht klären. Deshalb hat ProSiebenSat.1 sich für die Entwicklung einer individuellen Big-Data-Lösung zur Klärung dieser Fragen entschieden. inovex hat für die ProSiebenSat.1 AG ein Data-Science-Projekt auf der Grundlage eines Hadoop-Clusters umgesetzt.

Case Study "Data Science für ProSiebenSat.1" jetzt lesen
Big Data: Optimierte Betrugserkennung auf Microsoft Azure

Big Data: Optimierte Betrugserkennung auf Microsoft Azure

In einem Innovationsprojekt realisiert arvato Financial Solutions gemeinsam mit Microsoft, dem Cloud- und Big-Data-Spezialisten inovex GmbH und drei Pilotkunden aus dem E-Commerce-Bereich eine Big-Data-Architektur auf Microsoft Azure und lotet damit aus, wie durch die Kombination von Cloud Computing, Big Data und Advanced Analytics Betrugserkennung verbessert und neue Finance BPO-Services entwickelt werden können.

Case Study „Big Data auf Microsoft Azure“ jetzt lesen

Sie haben Fragen oder möchten zu diesem Thema beraten werden?

Dann rufen Sie uns an unter +49 (0)721 619 021-0 oder schreiben Sie uns eine E-Mail. Wir freuen uns auf Ihre Nachricht!

Weitere Themen:

Patrick Thoma

Ich freue mich auf Ihre Nachricht!

Patrick Thoma

Head of Data Management & Analytics

Big Data

Sébastien Jelsch / 08.10.2015

Optimierung von Analytischen Abfragen über Statistical Linked Data mit MapReduce

In diesem Kurzbeitrag zu einer laufenden Arbeit von inovexler Sébastien Jelsch wird eine Extract-Transform-Load (ETL) Pipeline vorgestellt, die extrem große Mengen an Linked Data automatisiert in ein horizontal skalierbares Open Source OLAP-System bereitstellen kann.

Beitrag jetzt lesen

inovex Theses

Anwendbarkeit von Anonymisierungstechniken im Bereich Big Data

Unser Masterstudent Andreas Bender befasste sich in seiner Abschlussarbeit mit dem spannenden Thema "Anonymisierungstechniken".

Big Data Thesis lesen

inovex Blog

Tech-Artikel im inovex Blog

Unsere Mitarbeiter schreiben regelmäßig Fachbeiträge in unserem Blog. Aktuelle Themen: Redis, Elasticsearch, Docker, Angular 2, Project Tango uvm.

Zum inovex Blog

Über uns

Unsere Technologie-Partner

Wir kooperieren mit Partnern, die unseren Kunden einen echten Mehrwert bieten: Cloudera, Elastic, Hortonworks, Liferay, MapR, Microsoft, Red Hat, Quobyte und UID.

Mehr Infos