MapR Cluster Administration Training

Training für System Engineers die MapR Cluster aufbauen und betreiben möchten.

 

 

MapR Cluster Administration Training

Zielgruppe: Administrators, System Engineers
Dauer: 3 Tage
Termine: 
24.09.–26.09.2019 (München)
Schulungszeiten: 9 – 17 Uhr
Anzahl Teilnehmer: min. 3, max. 12
Preis: 2.400 Euro zzgl. MwSt.

Dieses Training vermittelt alle Kenntnisse die notwendig sind, um Big-Data-Anwendungen auf Basis von Apache Spark 2.1 zu entwickeln. Die Teilnehmer lernen zunächst den Umgang mit der Spark-Shell, um Datensätze aus verschiedenen Quellen und Formaten zu laden und diese interaktiv zu analysieren. Darauf aufbauend entwickeln die Teilnehmer eine eigenständige Spark-Anwendung, um Daten in Form von Datasets und DataFrames lokal oder auf einem Rechencluster zu verarbeiten. Abgeschlossen wird das Training durch eine Einführung in Spark-Streaming zur Verarbeitung von Datenströmen, GraphFrame zur Analyse von Graphen, sowie der Machine-Learning-Bibliothek MLlib.

Agenda:

  • Einführung in die MapR Converged Data Platform (HDFS Kernkomponenten, MapR-FS Kernkomponenten, MapR-FS versus HDFS)
  • InstallationsvorbereitungSicherheitsmodi (Planung des Service Layouts, Vorbereitung der Cluster-Hardware, Testen von Nodes)
  • Installation der MapR Converged Data Platform (MapR Installer, Durchführen einer manuellen Installation, Lizenzierung des Clusters)
  • Verifizieren und Testen des Clusters (Verifizierung des Cluster Status, Post-Installation Benchmark Tests, Cluster-Strukturen)
  • Arbeiten mit Volumes (Einführung in Volumes, Cluster-Topologie, Attribute für Standard-Volumes, Entwicklung eines Volume-Plans, Anlegen und Konfiguration von Volumes)
  • Arbeiten mit Snapshots (Einführung in Snapshots, Arbeiten mit Snapshots, Verwendung und Verwaltung von Snapshots)
  • Arbeiten mit Mirrors (Einführung in Mirrors, Arbeiten mit lokalen Mirrors, Arbeiten mit remote Mirrors, Remote Mirrors und Disaster Recovery)
  • Konfiguration von User- und Cluster-Parametern (Management von Usern und Gruppen, Access Control Expressions (ACEs), User- und Gruppenquotas, Konfiguration von Topologie und Email-Benachrichtigungen)
  • Konfiguration der Cluster-Zugänge (Zugriff auf Daten im Cluster, Virtuelle IP Adressen für NFS-Zugriff, Client Konfiguration)
  • Cluster Monitoring und Management (Verwendung von MCS und CLI, MapR Monitoring, Reagieren auf Alarme)
  • Disk und Node Maintenance (Disks hinzufügen, Defekte Disks austauschen, Node Maintenance, Nodes hinzufügen)
  • Troubleshooting von Cluster-Problemen (Grundlegendes Troubleshooting, Tools und Utilities)
  • Installation und Konfiguration von YARN (YARN Services, YARN Job Execution Flow, YARN Konfiguration)

Hinweis:

  • Die Kursgebühr beinhaltet Schulungsunterlagen, Mittagessen, Getränke und Snacks.
  • Die Teilnehmer müssen ein eigenes Notebook zum Training mitbringen.

Trainer:

Rostislaw Krassow ist Big Data Engineer bei inovex. Rostislaw arbeitet seit 2015 im Hadoop-Umfeld mit Technologien wie Apache Spark, Hive, Drill, Flume, Sqoop und ist ein zertifizierter MapR-Trainer. Vor dem Einstieg in die Big-Data-Welt baute er Datenplattformen auf Basis von klassischen Datenbanken wie Oracle.

Collin Rogowski

Fragen zu unseren Trainings?

Collin Rogowski

Head of inovex Academy

Inhouse Trainings

Spark Training auch als Inhouse Training

Sie möchten gleich mehrere Ihrer Mitarbeiter schulen lassen? Und das bei Ihnen vor Ort und zu Ihrem Wunschtermin? Sprechen Sie uns an!

Zum Spark Inhouse Training

inovex Trainings

Spark Training

Mehr Informationen

inovex Blog

Florian Wilhelm I 10.04.2018

Managing isolated Environments with PySpark

Blog-Artikel lesen

inovex Blog

22.12.2016

24/7 Spark Streaming on YARN in Production

This article summarizes the lessons learned with running 24/7 Spark Streaming applications on YARN in a production environment.

Zum Blog-Artikel