Big Data

Die fortschreitende Digitalisierung verschiedener Lebens- und Arbeitsbereiche innerhalb unserer Gesellschaft macht stetig wachsende Mengen an Daten in verschiedensten Formen verfügbar.

Immer leistungsfähigere und immer stärker vernetzte Endgeräte wie Smartphones, Sensoren, Kameras, Maschinen und Server produzieren Mess-, Protokoll- und Verlaufsdaten, Commerce- und Social-Media-Plattformen generieren Aufzeichnungen von sozialen Interaktionen sowie Waren- und Finanztransaktionen.

Die Sammlung, Analyse und Auswertung dieser Daten helfen, bestehende Geschäftsmodelle besser und detaillierter zu verstehen und neue, „digitale“ Geschäftsmodelle und Produkte zu etablieren. Ein hochskalierbares Datenmanagement bildet die unverzichtbare Basis für viele Verfahren der Data Science, des Machine Learning und der Künstlichen Intelligenz.

„Big Data“ beschreibt als Sammelbegriff die in den letzten Jahren zu diesem Zweck entstandenen Technologien, Frameworks und Tools. Ihnen ist gemeinsam, dass sie als verteilte Systeme horizontal skalieren und ihre Laufzeiteigenschaften damit durch Hinzunahme weiterer Ressourcen vergleichsweise einfach an steigende Datenmengen angepasst werden können. Big-Data-Systeme können eine große Bandbreite an Datentypen aus verschiedensten Quellen sowohl in großen Batches als auch im kontinuierlichen Datenstrom mit niedrigen Latenzen verarbeiten. Mit diesen Eigenschaften bilden Big-Data-Technologien die Grundlage für komplexe analytische Auswertungen, für skalierbare reportingorientierte Datenplattformen und für verteilte Softwaresysteme mit eventbasiertem Verarbeitungsparadigma.

inovex beschäftigt sich bereits seit 2009 fundiert als einer der ersten IT-Dienstleister in Deutschland mit Big Data und hat in vielen Projekten produktive Unternehmenslösungen entwickelt und umgesetzt:

  • Data Lakes, Data Hubs, Datenplattformen
  • Intelligente, datengetriebene Services und Applikationen (Referenzen: mobile.de, REWE, Arvato)
  • Daten-Analyse- und Machine-Learning-Plattformen (Referenzen: EMQ, KOSMoS)
  • Hybride Data Warehouses, virtuelle Datenintegration (Referenzen: ProSiebenSat.1, dmTech, C. H. Beck Verlag)

Daher können wir Sie in allen Bereichen unterstützen: Von der Planung über die Entwicklung bis hin zum Betrieb von Big-Data-Systemen, sowohl auf On-Premises-Infrastrukturen als auch in der Cloud.

Technologie-Stack Big Data

  • Event Streaming Plattform: Kafka, Confluent
  • Streaming Data Processing: Spark Streaming, NiFi, Flink, Storm
  • Skalierbares Data Processing und Analytics: Spark, Databricks
  • Hadoop Data Platform Distributionen: MapR und Cloudera
  • SQL Abfragen auf Massendaten: Hive, Phoenix oder Drill
  • NoSQL-Datenbanken: HBase, Cassandra, Elasticsearch, Druid
  • Public Cloud (Big) Data Services: Microsoft Azure, Amazon AWS und Google Cloud
  • Container-basiertes Setup von Infrastruktur & Services: Docker, Kubernetes
  • Job-Steuerung, Orchestrierung: AirFlow, Argo, Oozie
  • Data Ingestion: NiFi, Flume, Sqoop
  • Data Governance und Cluster Security: Ranger, Kerberos, Navigator, Atlas

Wie können wir Sie unterstützen?

Nehmen Sie mit uns Kontakt auf – einfach per Telefon oder E-Mail.

Wir freuen uns auf Ihre Nachricht!


Weitere Themen:

Patrick Thoma

Ich freue mich auf Ihre Nachricht!

Patrick Thoma

Head of Data Management & Analytics

Projekt (EM²Q)

Expertensystem zur Qualitätsbewertung und Auswertung dreidimensionaler Massenspektroskopiedaten (EM²Q)

Im Projekt „Expertensystem zur Qualitätsbewertung und Auswertung 3-dimensionaler Massenspektroskopiedaten (EM²Q)“ ist in Zusammenarbeit mit der Hochschule Mannheim eine skalierbare Datenanalyseplattform entwickelt worden, mit der Messdaten aus der bildgebenden Massenspektrometrie auf ihre Qualität und Vergleichbarkeit untersucht werden können.

Zum Projekt (EM²Q)

inovex Case Study 2019

Aufbau einer hybriden BI-Architektur mit Big-Data-Komponenten für dmTECH

Case Study lesen

inovex Blog

Alexander Köhler | 08.01.2019

Grafana Loki: Scalable and Flexible Logfile Management

Right now there are three popular platforms to build a scalable and flexibel logfile management solution on-premise: splunk, elastic stack and grayling. [...]

Blog-Artikel lesen

inovex Vorträge

D. Benz (inovex), S. Hauck (dmTECH) | 2018

Big Data becomes Real-Time Data

Zum Vortrag