Big Data Platforms

"Big Data" meint in erster Näherung die schiere Datenmenge, die durch die zahllosen IT-Systeme dieser Welt produziert werden. Der Durchbruch der mobilen Devices – Smartphones, Tablets & Co. – hat in den letzten Jahren noch einmal für eine Explosion von Sensor-, Geolokalisierungs-, Verhaltens- oder Social-Media-Daten gesorgt.

Unter „Big Data“ verstehen wir aber nicht nur den Umgang mit sehr großen Datenmengen, sondern genauso die Sammlung und Verarbeitung von verschiedenartigen Daten (Web, Mobile, TV, Social, interne IT-Systeme etc.) und die extrem schnelle Verarbeitung von Daten (z. B. Realtime Targeting bei Online-Werbung).

inovex beschäftigt sich bereits seit 2009 fundiert mit Big-Data-Technologien und ist einer der ersten IT-Dienstleister in Deutschland, der über konkrete Projekterfahrung mit Big Data verfügt, von der Planung über die Entwicklung bis hin zum Betrieb von Big-Data-Systemen im Data Center.

Technologie-Stack Big Data

  • Hadoop, YARN, Map Reduce
  • Binary Data Formats: Thrift, Avro, Google Protocol Buffers, Kryo
  • Real-Time Datenverarbeitung: Storm
  • Cloud-based Big Data Platforms: HDInsight auf Azure
  • Interaktive Analysen mit Hive, Pig, Impala, Spark
  • Job-Steuerung mit Oozie
  • Data Ingestion: Flume, Sqoop
  • NoSQL-Datenbanken: HBase, Cassandra, Elasticsearch, MongoDB
  • Machine Learning / NLP / Data Mining: Mahout, R, UIMA
  • Big Data Analytics mit Datameer (Installation, Administration, Customizing, Erweiterungen)
Case Study: Big Data bei ProSiebenSat.1 Digital

Case Study: Big Data bei ProSiebenSat.1 Digital

inovex hat ProSiebenSat.1 Digital dabei unterstützt, auf Basis der Open-Source-Software Apache Hadoop eine komplexe Big-Data-Lösung für die Analyse des gesamten Web Traffic zu erstellen, der in der Unternehmensgruppe entsteht.

Case Study downloaden

Sie haben Fragen oder möchten zu diesem Thema beraten werden?

Dann rufen Sie uns an unter +49 (0)721 619 021-0 oder schreiben Sie uns eine E-Mail. Wir freuen uns auf Ihre Nachricht!

Weitere Themen:

Patrick Thoma

Ich freue mich auf Ihre Nachricht!

Patrick Thoma

Head of Data Management & Analytics

inovex Theses

Anwendbarkeit von Anonymisierungstechniken im Bereich Big Data

Unser Masterstudent Andreas Bender befasste sich in seiner Abschlussarbeit mit dem spannenden Thema "Anonymisierungstechniken".

Big Data Thesis lesen

Big Data

Sébastien Jelsch / 08.10.2015

Optimierung von Analytischen Abfragen über Statistical Linked Data mit MapReduce

In diesem Kurzbeitrag zu einer laufenden Arbeit von inovexler Sébastien Jelsch wird eine Extract-Transform-Load (ETL) Pipeline vorgestellt, die extrem große Mengen an Linked Data automatisiert in ein horizontal skalierbares Open Source OLAP-System bereitstellen kann.

Beitrag jetzt lesen

15.02.2017

inovex Blog

Elastic Stack: (Multi) Cluster Monitoring

Blog-Artikel jetzt lesen