Apache Spark Training für Data Scientists

Training rund um das Framework Apache Spark zur Echtzeit-Datenanalyse.

Spark Training bei inovex

Zielgruppe: Data Scientists
Dauer: 3 Tage
Termine: 17.-19.01.2017 (Karlsruhe, Trainer: Dominik Benz), 13.-15.02.2017 (Köln, Trainer: Robin Senge), 15.-17.03.2017 (Karlsruhe, Trainer: Hans-Peter Zorn)
Schulungszeiten: 9 – 17 Uhr 
Anzahl Teilnehmer: min. 3, max. 12 
Preis: 1.800 Euro zzgl. MwSt.

Abstract:

Egal ob Batch- oder Stream-Processing – Apache Spark hat sich dank seiner Performance als verteilte In-Memory-Technologie innerhalb von kurzer Zeit einen Stammplatz im Ökosystem der Big Data Tools erarbeitet.

Dieses Training richtet sich primär an Data Scientists und vermittelt den grundlegenden Aufbau und die Architektur von Spark, sowie den Umgang mit mächtigen Frontend-Tools aus dem Spark-Ökosystem zur Durchführung der Analysen.

Ein inhaltlicher Schwerpunkt des Trainings ist Machine Learning. Nach einer allgemeinen Einführung wird die Spark MLlib eingehend vorgestellt, eine Bibliothek, welche dem Anwender viele mächtige Machine-Learning-Algorithmen „out oft he box“ zur Verfügung stellt.

In diesem Training steht immer die Praxis im Vordergrund: Grundlage des Trainings ist eine komplexe Datenbasis an welcher Methoden, Tools & Techniken von den Teilnehmern geübt werden. Dabei wird Python als Programmiersprache verwendet.

Zielgruppe: Data Scientists

Dauer: 3 Tage

Agenda:

Tag 1 -- Spark

  • Einführung in Apache Spark
  • Einführung in Apache Zeppelin
  • Spark API und RDDs
  • KeyValue-RDD und Joins
  • Spark SQL und Dataframes/DataSets

Tag 2 -- Machine Learning

  • Einführung in Machine Learning
    • Supervised / Unsupervised Learning
    • Features Extraction
    • Validation

Tag 3 -- Machine Learning in der Praxis

  • Überblick über Modelle, Algorithmen und ihre Einsatzgebiete
  • Vor- und Aufbereitung der Daten
  • Machine Learning in der Praxis:
    • Anwendung von Spark ML auf einer großen Datenbasis

     

Trainer: 

Hans-Peter Zorn ist Big Data Scientist bei inovex. Seine Schwerpunkte sind Big Data Architekturen, Hadoop Security, Maschinelles Lernen und datengetriebene Produkte. Zuvor beschäftigte er sich am UKP Lab der TU Darmstadt mit der Analyse großer Textmengen mit Hadoop.

Dr. Dominik Benz arbeitet als Big Data Engineer bei inovex. Er beschäftigte sich hier unter anderem mit testgetriebener Big-Data-Anwendungsentwicklung, Implementierung von ETL-Prozessen auf Basis von Hadoop-Technologien (Hive, HBase) sowie deren Integration in klassische Business-Intelligence-Umgebungen.

Dr. Robin Senge ist Senior Big Data Scientist bei inovex. Er konzipiert und implementiert als Spezialist für Maschinelles Lernen ad-hoc Datenanalysen und datengetriebene Use-Cases u.a. auf Basis von Apache Spark.

"Spark für Data Scientists" Trainingsbeschreibung downloaden

Collin Rogowski

Fragen zu unseren Trainings?

Collin Rogowski

Head of inovex Academy

Inhouse Trainings

Big Data Training als Inhouse Training

Sie möchten gleich mehrere Ihrer Mitarbeiter schulen lassen? Und das bei Ihnen vor Ort und zu Ihrem Wunschtermin? Sprechen Sie uns an!

Zu den Big Data Inhouse Trainings