Hadoop Developer Training

In den letzten Jahren hat sich Hadoop als De-facto-Standard zur Analyse von großen und sehr großen Datenmengen etabliert.

Hadoop Developer Training bei inovex

Zielgruppe: Software-Entwickler, Software-Architekten
Dauer: 3 Tage
Termin: Termine auf Anfrage
Schulungszeiten: 9 – 17 Uhr
Anzahl Teilnehmer: min. 3, max. 12
Preis: 1.500 Euro zzgl. MwSt.

In den letzten Jahren hat sich Hadoop als De-facto-Standard zur Analyse von großen und sehr großen Datenmengen etabliert. Hadoop stellt Entwickler jedoch vor einige Herausforderungen: Zum einen wird mit Rohdaten auf fundamental andere Weise umgegangen als es bisher üblich war. Zum anderen erfordert die Entwicklung von Anfragen mit dem MapReduce-Paradigma ein Umdenken im Vergleich zu klassischen relationalen Anfragen. In diesem Training wird thematisiert wie mit Hilfe von Hadoop ein zentraler „Data-Lake“, bzw. „Data-Hub“ aufgebaut werden kann, der seinen Daten aus unterschiedlichsten, heterogenen Quellen erhält, um diese dann aufzubereiten, zu analysieren und anderen Systemen zur Verfügung zu stellen. Dabei steht immer die Praxis im Vordergrund: Grundlage des Trainings ist eine große & komplexe Datenbasis an welcher eben dieser Aufbau, sowie die diversen Tools & Techniken des Hadoop Ökosystems von den Teilnehmern geübt werden.

Agenda:

  • Überblick über das Hadoop Ökosystem
  • Hadoop-Grundlagen: MapReduce & HDFS
  • Die Hadoop 2 Architektur (YARN) (NameNode & DataNodes, ResourceManager, Hochverfügbare Hadoop-Cluster)
  • Entwicklung von Abfragen mit Hive
  • Datenaggregation mit Flume
  • Relationale Datenbanken anbinden mit Sqoop
  • Workflows entwickeln mit Oozie

Hinweis:

  • Die Kursgebühr beinhaltet Schulungsunterlagen, Teilnahmebescheinigung, Mittagessen, Getränke und Snacks
  • Die Teilnehmer müssen ein eigenes Notebook mit mind. 8GB RAM zum Training mitbringen.
  • Die Teilnehmer müssen vor dem Training ein VM-Image etc. herunterladen (Link geht ca. 1 Woche vor dem Training per E-Mail an die Teilnehmer)

Trainer:

Hans-Peter Zorn ist Big Data Scientist bei inovex. Seine Schwerpunkte sind Big Data Architekturen, Hadoop Security, Maschinelles Lernen und datengetriebene Produkte. Zuvor beschäftigte er sich am UKP Lab der TU Darmstadt mit der Analyse großer Textmengen mit Hadoop.

Collin Rogowski

Fragen zu unseren Trainings?

Collin Rogowski

Head of inovex Academy

Inhouse Trainings

Big Data Training als Inhouse Training

Sie möchten gleich mehrere Ihrer Mitarbeiter schulen lassen? Und das bei Ihnen vor Ort und zu Ihrem Wunschtermin? Sprechen Sie uns an!

Zu den Big Data Inhouse Trainings