Apache Spark Training

The training sessions are usally held in German. Please contact us if you are interested in training sessions in English.

Spark Training bei inovex

Zielgruppe: Analysten, Software-Entwickler, Software-Architekten
Dauer: 2 Tage
Termine: 17.10.–18.10.2017 (Hamburg), 08.11.–09.11.2017 (Karlsruhe)
Schulungszeiten: 9 – 17 Uhr 
Anzahl Teilnehmer: min. 3, max. 12 
Preis: 1.200 Euro zzgl. MwSt.

Abstract:

Egal ob Batch- oder Stream-Processing – Apache Spark hat sich dank seiner Performance als verteilte In-Memory-Technologie innerhalb kurzer Zeit einen Stammplatz im Ökosystem der Big Data Tools erarbeitet.

Dieses Training führt in den Umgang mit Spark zur Analyse großer Datenmengen ein. Dabei werden sowohl Batch- als auch Streamingverfahren diskutiert. Ein Schwerpunkt des Trainings ist die Formulierung von analytischen Anfragen und die Nutzung maschineller Lernverfahren. Ausgehend von konkreten Business-Anforderungen lernen die Teilnehmer geeignete Architekturen, Techniken und Tools kennen, um Lösungen zu implementieren, welche die Business-Anforderungen befriedigen.

In diesem Training steht immer die Praxis im Vordergrund: Grundlage des Trainings ist eine komplexe Datenbasis an welcher Methoden, Tools & Techniken von den Teilnehmern geübt werden.

Zielgruppe: Analysten, Software-Entwickler, Architekten

Dauer: 2 Tage

Agenda:

  • Spark Grundlagen und Architektur
  • Spark APIs und die RDD Datenstruktur
  • Abfragen formulieren mit Spark SQL
  • Transformationen und Aktionen im Spark-Kontext
  • Zeppelin als Spark-Frontend
  • Machine Learning mittels der Spark MLlib
  • Überblick über das Apache-Spark-Ökosystem
  • Design von Spark-Architekturen zur Umsetzung konkreter Usecases

Hinweis:

  • Die Kursgebühr beinhaltet Schulungsunterlagen, Teilnahmebescheinigung, Mittagessen, Getränke und Snacks
  • Die Teilnehmer müssen ein eigenes Notebook zum Training mitbringen.

Trainer (je nach Termin): 

Hans-Peter Zorn ist Big Data Scientist bei inovex. Seine Schwerpunkte sind Big Data Architekturen, Hadoop Security, Maschinelles Lernen und datengetriebene Produkte. Zuvor beschäftigte er sich am UKP Lab der TU Darmstadt mit der Analyse großer Textmengen mit Hadoop.

Dr. Dominik Benz arbeitet als Big Data Engineer bei inovex. Er beschäftigte sich hier unter anderem mit testgetriebener Big-Data-Anwendungsentwicklung, Implementierung von ETL-Prozessen auf Basis von Hadoop-Technologien (Hive, HBase) sowie deren Integration in klassische Business-Intelligence-Umgebungen.

Dr. Robin Senge ist Senior Big Data Scientist bei inovex. Er konzipiert und implementiert als Spezialist für Maschinelles Lernen ad-hoc Datenanalysen und datengetriebene Use-Cases u.a. auf Basis von Apache Spark.