Apache Spark für Data Scientists
Training rund um das Framework Apache Spark zur Echtzeit-Datenanalyse.

Auf einen Blick
Rahmendaten
- 2 Tage praxisorientiertes Training (vor Ort)
- 3 Tage praxisorientiertes Training (remote)
Zielgruppe
Data Scientists
Anwendungsbeispiele
Einsatz von Machine Learning (Anwendung von Spark ML auf einer großen Datenbasis)
Beschreibung
Egal ob Batch- oder Stream-Processing – Apache Spark hat sich dank seiner Performance als verteilte In-Memory-Technologie innerhalb von kurzer Zeit einen Stammplatz im Ökosystem der Big Data Tools erarbeitet. Dieses Training richtet sich primär an Data Scientists und vermittelt den grundlegenden Aufbau und die Architektur von Spark, sowie den Umgang mit mächtigen Frontend-Tools aus dem Spark-Ökosystem zur Durchführung der Analysen.
Ein inhaltlicher Schwerpunkt des Trainings ist Machine Learning. Nach einer allgemeinen Einführung wird die Spark MLlib eingehend vorgestellt, eine Bibliothek, welche den Anwender:innen viele mächtige Machine-Learning-Algorithmen „out of the box“ zur Verfügung stellt.
In diesem Training steht immer die Praxis im Vordergrund: Grundlage des Trainings ist eine komplexe Datenbasis an welcher Methoden, Tools & Techniken von den Teilnehmer:innen geübt werden. Dabei wird Python als Programmiersprache verwendet.
Agenda
Tag 1 — Spark
- Einführung in Apache Spark
- Einführung in Apache Zeppelin
- Spark API und RDDs
- KeyValue-RDD und Joins
- Spark SQL und Dataframes/DataSet
Tag 2 — Machine Learning
- Einführung in Machine Learning
- Supervised / Unsupervised Learning
- Features Extraction
- Validation
Tag 3 — Machine Learning in der Praxis
- Überblick über Modelle, Algorithmen und ihre Einsatzgebiete
- Vor- und Aufbereitung der Daten
- Machine Learning in der Praxis:
- Anwendung von Spark ML auf einer großen Datenbasis
Trainingsformen
Trainingsformen ganz nach Ihren Bedürfnissen: Offene Trainings finden zu festen Terminen in gemischten Gruppen an einem inovex Standort statt, Inhouse-Trainings buchen sie individuell – Rahmenbedingungen anpassbar.
Inhouse Training
- Trainingsagenda auf die Gruppe und das Projekt anpassbar
- vertrauliche Atmosphäre (Trainer:innen sind unter NDA)
- Rahmenbedingungen anpassbar: Ort, Zeiten, Sprache, Tooling
Offenes Training
- optimal für Einzelpersonen
- neue Impulse durch andere Teilnehmende
- Kennenlernen von anderen Tech-interessierten Menschen
Trainer:innen
Unsere Trainer:innen sind praxiserprobte Expert:innen in ihren Leistungsbereichen. Durch ihren Einsatz in Projekten bauen sie Tag für Tag ihr Wissen aus und vermitteln dieses Know-how in ihren Trainings weiter – anwendungsbezogen und praxisorientiert.

Hans-Peter Zorn

Dr. Dominik Benz
