Apache Spark für Data Scientists

Training rund um das Framework Apache Spark zur Echtzeit-Datenanalyse.

Jetzt anfragen
Apache Spark Logo

Auf einen Blick

Rahmendaten

  • 2 Tage praxisorientiertes Training (vor Ort)
  • 3 Tage praxisorientiertes Training (remote)

Zielgruppe

Data Scientists

Anwendungsbeispiele

Einsatz von Machine Learning (Anwendung von Spark ML auf einer großen Datenbasis)

Beschreibung

Egal ob Batch- oder Stream-Processing – Apache Spark hat sich dank seiner Performance als verteilte In-Memory-Technologie innerhalb von kurzer Zeit einen Stammplatz im Ökosystem der Big Data Tools erarbeitet. Dieses Training richtet sich primär an Data Scientists und vermittelt den grundlegenden Aufbau und die Architektur von Spark, sowie den Umgang mit mächtigen Frontend-Tools aus dem Spark-Ökosystem zur Durchführung der Analysen.

Ein inhaltlicher Schwerpunkt des Trainings ist Machine Learning. Nach einer allgemeinen Einführung wird die Spark MLlib eingehend vorgestellt, eine Bibliothek, welche den Anwender:innen viele mächtige Machine-Learning-Algorithmen „out of the box“ zur Verfügung stellt.

In diesem Training steht immer die Praxis im Vordergrund: Grundlage des Trainings ist eine komplexe Datenbasis an welcher Methoden, Tools & Techniken von den Teilnehmer:innen geübt werden. Dabei wird Python als Programmiersprache verwendet.

Agenda

Tag 1 — Spark

  • Einführung in Apache Spark
  • Einführung in Apache Zeppelin
  • Spark API und RDDs
  • KeyValue-RDD und Joins
  • Spark SQL und Dataframes/DataSet

 

Tag 2 — Machine Learning

  • Einführung in Machine Learning
    • Supervised / Unsupervised Learning
    • Features Extraction
    • Validation

 

Tag 3 — Machine Learning in der Praxis

  • Überblick über Modelle, Algorithmen und ihre Einsatzgebiete
  • Vor- und Aufbereitung der Daten
  • Machine Learning in der Praxis:
    • Anwendung von Spark ML auf einer großen Datenbasis
Apache Spark für Data Scientists
2.100,00 €* zzgl. MwSt.
Dieses Training findet derzeit auf Anfrage statt – jetzt Kontakt aufnehmen.
Jetzt anfragen
2.100,00 €* zzgl. MwSt.

Trainingsformen

Trainingsformen ganz nach Ihren Bedürfnissen: Offene Trainings finden zu festen Terminen in gemischten Gruppen an einem inovex Standort statt, Inhouse-Trainings buchen sie individuell – Rahmenbedingungen anpassbar.

Inhouse Training

  • Trainingsagenda auf die Gruppe und das Projekt anpassbar
  • vertrauliche Atmosphäre (Trainer:innen sind unter NDA)
  • Rahmenbedingungen anpassbar: Ort, Zeiten, Sprache, Tooling
Jetzt anfragen

Offenes Training

  • optimal für Einzelpersonen
  • neue Impulse durch andere Teilnehmende
  • Kennenlernen von anderen Tech-interessierten Menschen

Trainer:innen

Unsere Trainer:innen sind praxiserprobte Expert:innen in ihren Leistungsbereichen. Durch ihren Einsatz in Projekten bauen sie Tag für Tag ihr Wissen aus und vermitteln dieses Know-how in ihren Trainings weiter – anwendungsbezogen und praxisorientiert.

Portraitfoto von Hans-Peter Zorn

Hans-Peter Zorn

Hans-Peter Zorn ist als Head of AI und CTO bei inovex tätig, um Kunden dabei zu unterstützen, ihre Herausforderungen zu bewältigen – gelegentlich auch mithilfe von KI. Er studierte Computerlinguistik in Heidelberg sowie Informatik am KIT. Anschließend beschäftigte er sich lange Zeit mit Sprachdialogsystemen, Natural Language Processing und Big-Data-Architekturen.
Profilbild Dominik Benz

Dr. Dominik Benz

Dr. Dominik Benz arbeitet als Big Data Engineer bei inovex. Er beschäftigte sich hier unter anderem mit testgetriebener Big-Data-Anwendungsentwicklung, Implementierung von ETL-Prozessen auf Basis von Hadoop-Technologien (Hive, HBase) sowie deren Integration in klassische Business-Intelligence-Umgebungen.
Robin Senge in schwarz/weiß, Trainer

Dr. Robin Senge

Dr. Robin Senge ist Head of Machine Learning bei inovex. Er konzipiert und implementiert als Spezialist für Maschinelles Lernen ad-hoc Datenanalysen und datengetriebene Use-Cases u.a. auf Basis von Apache Spark.

Häufig gestellte Fragen

Erlange ich durch das Training eine Zertifizierung?
Alle Teilnehmer:innen erhalten nach dem Training ein Teilnahmezertifikat der inovex Academy.
Auf welcher Basis wurden die Trainingsinhalte gestaltet?
Grundlage dieses Trainings sind die langjährigen Erfahrungen der Trainer:innen mit Apache Spark in unseren Kundenprojekten.
Wie kann ich mich auf das Training vorbereiten?
Du solltest eine lauffähige, dir bekannte Entwicklungsumgebung für Python einsatzbereit haben.
Wann fängt das Training an?
Unsere Trainings starten um 09:00 Uhr mitteleuropäischer Zeit.
Bekomme ich eine Einladung? Wann bekomme ich die?
Der/die Trainer:in verschickt ca. 1 Woche vor Trainingsbeginn die Einladungen. Neben der Agenda und dem Ablauf wird da auch nochmals genau auf etwaige Vorbereitungen (Installation von Software etc.) hingewiesen.

Apache Spark für Data Scientists

Erweitern Sie Ihre Fähigkeiten und bauen Sie Ihre Expertise aus! Unsere erfahrenen Trainer:innen unterstützen Sie dabei, Ihre Ziele zu erreichen. Melden Sie sich an und bringen Sie Ihr Know-how auf ein neues Level! Jetzt anfragen