Dataprocessing mit Spark (Batch & Stream) Training

Die Teilnehmenden lernen in diesem Hands-on-Kurs, wie moderne Lakehouse-Architekturen in der Databricks Cloud mittels Spark (Verarbeitung) und Delta Lake (Storage) aufgebaut werden können.

Jetzt anfragen

Home / Academy / Dataprocessing mit Spark (Batch & Stream) Training

Auf einen Blick

Rahmendaten

2 Tage

vor Ort (Karlsruhe) oder remote
Deutsch oder Englisch

Zielgruppe

Software-Entwickler:innen mit Grundkenntnissen in Python, Jupyter-Notebooks und im Umgang mit Daten (z. B. SQL, DataFrames etc.)

Anwendungsbeispiele

Bereitstellung skalierbarer Analysen und Dashboards auf Basis großer Datenmengen
Entwicklung streamingbasierter Datenapplikationen, z. B. zur Verarbeitung hochvolumiger Sensor- oder Bewegungsdaten

Beschreibung

In diesem Training werden die Grundlagen der skalierbaren Datenverarbeitungs-Engine Apache Spark und der Cloud-Plattform Databricks vermittelt. Kombiniert ermöglichen sie die Entwicklung hochperformanter Batch- und Stream-basierten Applikationen zur Analyse und Transformation großer Datenmengen.

Die Teilnehmenden lernen in diesem Hands-on-Kurs, wie moderne Lakehouse-Architekturen in der Databricks Cloud mittels Spark (Verarbeitung) und Delta Lake (Storage) aufgebaut werden können.

Alle Konzepte werden theoretisch eingeführt und dann mittels Übungen in einer vorbereiteten Databricks-Umgebung vertieft. Der Fokus liegt dabei sowohl auf einem guten technischen Verständnis als auch auf der praktischen Umsetzung, sodass die Teilnehmenden im Anschluss an das Training direkt in der Lage sind, die thematisierten Technologien in eigenen Projekten einzusetzen.

Agenda

Einführung in die Grundlagen und Architektur von Apache Spark

Datentransformationen mit Spark SQL und Spark DataFrames
Databricks Lakehouse Architecture & Unity Catalog
Databricks Workspaces, Notebooks, Cluster und Workflows
Delta Lake und optimierte Datenhaltung
Spark Structured Streaming
Stateful Streaming mit Watermarks

Typische Fragen, die wir beantworten:

Welche Vorteile bietet Spark gegenüber anderen Ansätzen?
Für welche Anwendungsfälle sind Streaming-Architekturen sinnvoll?
Wie funktionieren Datentransformationen mit Spark?
Was ist ein Delta Lake und wann setzt man ihn am besten ein?
Wie kann Stateful Streaming in Spark realisiert werden?
Wie wird Spark in der Databricks Umgebung am besten eingesetzt?
Was versteht man unter einer Lakehouse Architektur?

Dataprocessing mit Spark (Batch & Stream) Training

signiertes Teilnahmezertifikat
firmeninternes Training
Anpassungen möglich (Agenda, Tech-Stack, Sprache, usw.)
kleine Trainingsgruppen

Jetzt anfragen

Trainer:innen

Unsere Trainer:innen sind praxiserprobte Expert:innen in ihren Leistungsbereichen. Durch ihren Einsatz in Projekten bauen sie Tag für Tag ihr Wissen aus und vermitteln dieses Know-how in ihren Trainings weiter – anwendungsbezogen und praxisorientiert.

Simon Bachstein

Databricks Certified Data Engineer Professional

Zertifizierungsabzeichen von databricks spark developer associate

Simon Bachstein entwickelt seit 2019 als Data Engineer mit mathematischem Hintergrund nicht nur smarte und innovative Datenprodukte,sondern gestaltet auch Datenlandschaften mit Fokus auf Qualität, Effizienz, Sicherheit und Nutzerfreundlichkeit.

Als Trainer vermittelt Simon gerne tiefes Verständnis für die Technologie, verliert dabei aber nicht den Bezug zur Praxis und sucht den Austausch zu konkreten Problemstellungen.

Weitere Trainings mit Simon Bachstein →

Warum inovex Academy?

Unser Angebot

Die inovex Academy hat es sich zur Aufgabe gemacht, Wissen über Methoden und Technologien weiterzugeben, die wir in unseren Projekten bereits erfolgreich einsetzen.

Kuratierte Inhalte

Unsere Trainer:innen erstellen in Absprache mit Ihnen ein individuelles Trainingsangebot auf Basis Ihrer Anforderungen.

Anpassbarer Tech Stack

In den exklusiven Trainings können wir Ihren Tech Stack für die Trainingsinhalte berücksichtigen.

Individuelle Hilfestellung

Bei Bedarf können wir das Training auf einen konkreten Use Case Ihres Unternehmens ausrichten und direkt auf Basis Ihrer Daten arbeiten.

Unser Vorgehen bei Trainings

Von der Bedarfsanalyse bis zur Zertifikatsvergabe bieten wir maßgeschneiderte Trainings, die flexibel gestaltet und nach Ihren spezifischen Anforderungen durchgeführt werden.

Wenn Sie an einem Inhouse-Training interessiert sind, beginnen wir im ersten Gespräch, Ihren Bedarf zu ermitteln und Ihre Ziele zu besprechen. Dieses Gespräch bildet die Grundlage für ein erstes Angebot.

Sobald die Rahmendaten geklärt sind, beginnen unsere Trainer:innen mit der Anpassung der Trainingsinhalte. Viele unserer Trainings sind modular aufgebaut und bieten die Möglichkeit, die Agenda flexibel zu gestalten. Trainings, die auf Zertifizierungen vorbereiten, sind dagegen weniger flexibel. Hier können Sie jedoch den inhaltlichen Fokus nach Ihren Wünschen setzen.

Im Vorfeld des Trainings bekommen Sie alle relevanten Informationen zugesendet. Im Anschluss erfolgt das Training in den von Ihnen gewünschten Räumen und zur verabredeten Zeit. Hier richten sich unsere Trainer:innen nach Ihren Anforderungen.

Nach dem Abschluss des Trainings bekommen alle Teilnehmenden eine Urkunde zur Teilnahmebestätigung. Sie bekommen außerdem die Möglichkeit, uns Feedback zu den Inhalten und dem Ablauf zu geben. Wir freuen uns immer über Lob und Verbesserungsvorschläge.

Häufig gestellte Fragen

Für das Training reicht ein eigener Laptop mit Webbrowser aus. Von diesem wird auf die bereitgestellte webbasierte Python-Entwicklungsumgebung zugegriffen.

Die Übungsaufgaben finden in einer eigens hierfür bereitgestellten Databricks / Spark Umgebung statt. In den vorbereiteten Übungen werden die besprochenen Konzepte geübt, in dem realistische Entwicklungsaufgaben in der Databricks / Spark Umgebung durchgeführt werden.

Nein, Databricks Zugänge werden von der inovex Academy zur Verfügung gestellt.

Ergänzende Informationen

Allgemeine Geschäftsbedingungen

Stornierungsbedingungen

Zurück

Ihr Erfolgspartner für effektive Trainings

Gerne sprechen wir persönlich mit Ihnen über Ihr Anliegen.
Kontaktieren Sie uns noch heute!

Collin Rogowski

Head of inovex Academy

Anrufen E-Mail senden

Individuelles Trainingsangebot für Ihr Unternehmen
Über 25 Jahre Erfahrung als inovex Academy

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website
Zweck	Speichert die Einstellungen der Besucher, die in der Cookie Box von Borlabs Cookie ausgewählt wurden.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Akzeptieren
Name	Google Analytics
Anbieter	Google LLC
Zweck	Cookie von Google für Website-Analysen. Erzeugt statistische Daten darüber, wie der Besucher die Website nutzt.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Jahre

Akzeptieren
Name	Hotjar
Anbieter	Hotjar Ltd.
Zweck	Hotjar ist ein Analysewerkzeug für das Benutzerverhalten von Hotjar Ltd. Wir verwenden Hotjar, um zu verstehen, wie Benutzer mit unserer Website interagieren.
Datenschutzerklärung	https://www.hotjar.com/legal/policies/privacy/
Host(s)	*.hotjar.com
Cookie Name	_hjClosedSurveyInvites, _hjDonePolls, _hjMinimizedPolls, _hjDoneTestersWidgets, _hjIncludedInSample, _hjShownFeedbackMessage, _hjid, _hjRecordingLastActivity, hjTLDTest, _hjUserAttributesHash, _hjCachedUserAttributes, _hjLocalStorageTest, _hjptid
Cookie Laufzeit	Sitzung / 1 Jahr

Akzeptieren
Name	HubSpot
Anbieter	HubSpot Inc.
Zweck	HubSpot ist ein Verwaltungsdienst für Benutzerdatenbanken bereitgestellt von HubSpot, Inc. Wir nutzen HubSpot auf dieser Website für unsere Online Marketing-Aktivitäten.
Datenschutzerklärung	https://legal.hubspot.com/privacy-policy
Host(s)	*.hubspot.com, hubspot-avatars.s3.amazonaws.com, hubspot-realtime.ably.io, hubspot-rest.ably.io, js.hs-scripts.com
Cookie Name	__hs_opt_out, __hs_d_not_track, hs_ab_test, hs-messages-is-open, hs-messages-hide-welcome-message, __hstc, hubspotutk, __hssc, __hssrc, messagesUtk
Cookie Laufzeit	Sitzung / 30 Minuten / 1 Tag / 1 Jahr / 13 Monate

Akzeptieren
Name	OpenStreetMap
Anbieter	OpenStreetMap Foundation
Zweck	Wird verwendet, um OpenStreetMap-Inhalte zu entsperren.
Datenschutzerklärung	https://wiki.osmfoundation.org/wiki/Privacy_Policy
Host(s)	.openstreetmap.org
Cookie Name	_osm_location, _osm_session, _osm_totp_token, _osm_welcome, _pk_id., _pk_ref., _pk_ses., qos_token
Cookie Laufzeit	1-10 Jahre

Dataprocessing mit Spark (Batch & Stream) Training

Auf einen Blick

Rahmendaten

Zielgruppe

Anwendungsbeispiele

Beschreibung

Agenda

Typische Fragen, die wir beantworten:

Trainer:innen

Simon Bachstein

Warum inovex Academy?

Kuratierte Inhalte

Anpassbarer Tech Stack

Individuelle Hilfestellung

Unser Vorgehen bei Trainings

Häufig gestellte Fragen

Was benötige ich für dieses Training?

Welche Art von Übungsaufgaben gibt es?

Benötige ich einen eigenen Databricks Account für das Training?

Ergänzende Informationen

Collin Rogowski

Ich freue mich auf Ihre Anfrage.

Collin Rogowski

Ihr Erfolgspartner für effektive Trainings

Collin Rogowski