Hadoop Developer Training

The training sessions are usally held in German. Please contact us if you are interested in training sessions in English.

In den letzten Jahren hat sich Hadoop als De-facto-Standard zur Analyse von großen und sehr großen Datenmengen etabliert. Hadoop stellt Entwickler jedoch vor einige Herausforderungen: Zum einen wird mit Rohdaten auf fundamental andere Weise umgegangen als es bisher üblich war. Zum anderen erfordert die Entwicklung von Anfragen mit dem MapReduce-Paradigma ein Umdenken im Vergleich zu klassischen relationalen Anfragen. In diesem Training wird thematisiert wie mit Hilfe von Hadoop ein zentraler „Data-Lake“, bzw. „Data-Hub“ aufgebaut werden kann, der seinen Daten aus unterschiedlichsten, heterogenen Quellen erhält, um diese dann aufzubereiten, zu analysieren und anderen Systemen zur Verfügung zu stellen. Dabei steht immer die Praxis im Vordergrund: Grundlage des Trainings ist eine große & komplexe Datenbasis an welcher eben dieser Aufbau, sowie die diversen Tools & Techniken des Hadoop Ökosystems von den Teilnehmern geübt werden.

Agenda:

  • Überblick über das Hadoop Ökosystem
  • Hadoop-Grundlagen: MapReduce & HDFS
  • Die Hadoop 2 Architektur (YARN) (NameNode & DataNodes, ResourceManager, Hochverfügbare Hadoop-Cluster)
  • Entwicklung von Abfragen mit Hive
  • Datenaggregation mit Flume
  • Relationale Datenbanken anbinden mit Sqoop
  • Workflows entwickeln mit Oozie

Hinweis:

  • Die Kursgebühr beinhaltet Schulungsunterlagen, Teilnahmebescheinigung, Mittagessen, Getränke und Snacks
  • Die Teilnehmer müssen ein eigenes Notebook mit mind. 8GB RAM zum Training mitbringen.
  • Die Teilnehmer müssen vor dem Training ein VM-Image etc. herunterladen (Link geht ca. 1 Woche vor dem Training per E-Mail an die Teilnehmer)

Trainerin:

Dr. Kathrin Björkelund arbeitet als Big Data Engineer bei inovex. Sie hat Informatik und Computerlinguistik in Saarbrücken studiert und wurde 2011 von der Universität Potsdam promoviert. Im Rahmen eines Forschungsprojektes kam sie erstmals mit Hadoop und MapReduce in Kontakt und hat sich dann auf dieses Ökosystem spezialisiert. Sie hat zudem langjährige Erfahrung mit der automatischen, datengesteuerten Verarbeitung natürlicher Sprache, maschinellen Lernverfahren sowie Trainings- und Lehrmethoden.

"Hadoop Developer Training" Trainingsbeschreibung downloaden

Hadoop Developer Training bei inovex

Zielgruppe: Software-Entwickler, Software-Architekten
Dauer: 3 Tage
Termin: Termine auf Anfrage
Schulungszeiten: 9 – 17 Uhr
Anzahl Teilnehmer: min. 3, max. 12
Preis: 1.500 Euro zzgl. MwSt.