Hadoop Developer Inhouse Training

In den letzten Jahren hat sich Hadoop als De-facto-Standard zur Analyse von großen und sehr großen Datenmengen etabliert.

Hadoop Developer Inhouse Training

Hadoop stellt Entwickler jedoch vor einige Herausforderungen: Zum einen wird mit Rohdaten auf fundamental andere Weise umgegangen als es bisher üblich war. Zum anderen erfordert die Entwicklung von Anfragen mit dem MapReduce-Paradigma ein Umdenken im Vergleich zu klassischen relationalen Anfragen. Darüber hinaus ist um das „einfache“ MapReduce-Tool Hadoop herum mittlerweile ein ganzes Ökosystem von Technologien für die unterschiedlichsten Anwendungsfälle entstanden: von der verteilten Datenspeicherung über die Exploration und Analyse bis hin zur automatischen Klassifizierung und Vorhersage. In diesem Training steht immer die Praxis im Vordergrund: Grundlage des Trainings ist eine große & komplexe Datenbasis an welcher Methoden, Tools & Techniken von den Teilnehmern geübt werden. 

Agenda:

  • Überblick über das Hadoop Ökosystem
  • Hadoop-Grundlagen: MapReduce & HDFS
  • Die Hadoop 2 Architektur (YARN) (NameNode & DataNodes, ResourceManager, Hochverfügbare Hadoop-Cluster)
  • Entwicklung von Abfragen mit Hive
  • Datenaggregation mit Flume
  • Relationale Datenbanken anbinden mit Sqoop
  • Workflows entwickeln mit Oozie

Zielgruppe:  Software-Entwickler, Software-Architekten

Dauer:          3 Tage

"Hadoop Developer" Trainingsbeschreibung downloaden