Kostenloses Online Meetup: Generative AI mit Adalab (28. März) Mehr erfahren 
Apache Spark Logo

Apache Spark für Data Scientists

Zielgruppe: Data Scientists
Anfrage stellen

Egal ob Batch- oder Stream-Processing – Apache Spark hat sich dank seiner Performance als verteilte In-Memory-Technologie innerhalb von kurzer Zeit einen Stammplatz im Ökosystem der Big Data Tools erarbeitet.

Dieses Training führt in den Umgang mit Spark zur Analyse großer Datenmengen ein. Dabei werden sowohl Batch- als auch Streamingverfahren diskutiert. Ein Schwerpunkt des Trainings ist die Formulierung von analytischen Anfragen und die Nutzung maschineller Lernverfahren. Ausgehend von konkreten Business Anforderungen lernen die Teilnehmer:innen geeignete Architekturen, Techniken und Tools kennen, um Lösungen zu implementieren, welche die Business Bedürfnisse befriedigen.

In diesem Training steht immer die Praxis im Vordergrund: Grundlage des Trainings ist eine komplexe Datenbasis an welcher Methoden, Tools & Techniken von den Teilnehmer:innenn geübt werden.

 

Agenda:

  • Spark Grundlagen und Architektur
  • Spark APIs und die RDD Datenstruktur
  • Abfragen formulieren mit Spark SQL
  • Transformationen und Aktionen im Spark Kontext
  • Machine Learning mittels der Spark MLlib
  • Überblick über das Apache Spark Ökosystem
  • Design von Spark-Architekturen zur Umsetzung konkreter Usecases
Anfrage stellen „Apache Spark für Data Scientists“ Trainingsbeschreibung PDF, 55.78 kB

Ihre Trainer:

Portraitfoto von Hans-Peter Zorn

Hans-Peter Zorn

Big Data Scientist Mehr Lesen

Dr. Dominik Benz

Head of Machine Learning Engineering Mehr Lesen
Robin Senge in schwarz/weiß, Trainer

Dr. Robin Senge

Head of Machine Learning Mehr Lesen

Wie können wir Sie unterstützen?

Collin Rogowski

Head of inovex Academy

ZURÜCK ZUR ÜBERSICHT