MapR Cluster Administration Inhouse Training

Training für System Engineers, die MapR Cluster aufbauen und betreiben möchten.

Zielgruppe: Administrators, System Engineers
Dauer: 3 Tage

Dieses Training vermittelt alle Kenntnisse die notwendig sind, um Big-Data-Anwendungen auf Basis von Apache Spark 2.1 zu entwickeln.

Die Teilnehmer lernen zunächst den Umgang mit der Spark-Shell, um Datensätze aus verschiedenen Quellen und Formaten zu laden und diese interaktiv zu analysieren. Darauf aufbauend entwickeln die Teilnehmer eine eigenständige Spark-Anwendung, um Daten in Form von Datasets und DataFrames lokal oder auf einem Rechencluster zu verarbeiten. Abgeschlossen wird das Training durch eine Einführung in Spark-Streaming zur Verarbeitung von Datenströmen, GraphFrame zur Analyse von Graphen, sowie der Machine-Learning-Bibliothek MLlib.

Agenda

  • Einführung in die MapR Converged Data Platform (HDFS Kernkomponenten, MapR-FS Kernkomponenten, MapR-FS versus HDFS)
  • InstallationsvorbereitungSicherheitsmodi (Planung des Service Layouts, Vorbereitung der Cluster-Hardware, Testen von Nodes)
  • Installation der MapR Converged Data Platform (MapR Installer, Durchführen einer manuellen Installation, Lizenzierung des Clusters)
  • Verifizieren und Testen des Clusters (Verifizierung des Cluster Status, Post-Installation Benchmark Tests, Cluster-Strukturen)
  • Arbeiten mit Volumes (Einführung in Volumes, Cluster-Topologie, Attribute für Standard-Volumes, Entwicklung eines Volume-Plans, Anlegen und Konfiguration von Volumes)
  • Arbeiten mit Snapshots (Einführung in Snapshots, Arbeiten mit Snapshots, Verwendung und Verwaltung von Snapshots)
  • Arbeiten mit Mirrors (Einführung in Mirrors, Arbeiten mit lokalen Mirrors, Arbeiten mit remote Mirrors, Remote Mirrors und Disaster Recovery)
  • Konfiguration von User- und Cluster-Parametern (Management von Usern und Gruppen, Access Control Expressions (ACEs), User- und Gruppenquotas, Konfiguration von Topologie und Email-Benachrichtigungen)
  • Konfiguration der Cluster-Zugänge (Zugriff auf Daten im Cluster, Virtuelle IP Adressen für NFS-Zugriff, Client Konfiguration)
  • Cluster Monitoring und Management (Verwendung von MCS und CLI, MapR Monitoring, Reagieren auf Alarme)
  • Disk und Node Maintenance (Disks hinzufügen, Defekte Disks austauschen, Node Maintenance, Nodes hinzufügen)
  • Troubleshooting von Cluster-Problemen (Grundlegendes Troubleshooting, Tools und Utilities)
  • Installation und Konfiguration von YARN (YARN Services, YARN Job Execution Flow, YARN Konfiguration)

 

Hinweis:

  • Die Kursgebühr beinhaltet alle Schulungsunterlagen.
  • Die Teilnehmer müssen ein eigenes Notebook zum Training mitbringen.

Trainer:

Rostislaw Krassow ist Big Data Engineer bei inovex. Rostislaw arbeitet seit 2015 im Hadoop-Umfeld mit Technologien wie Apache Spark, Hive, Drill, Flume, Sqoop und ist ein zertifizierter MapR-Trainer. Vor dem Einstieg in die Big-Data-Welt baute er Datenplattformen auf Basis von klassischen Datenbanken wie Oracle.

Sie haben Interesse an diesem Inhouse Training?

Dann rufen Sie uns an unter +49 (0)172 5673497 oder schreiben Sie uns eine E-Mail. Wir freuen uns auf Ihre Nachricht und senden Ihnen gerne ein individuelles Angebot zu!

Collin Rogowski

Sie haben Interesse an diesem Training?

Collin Rogowski

Head of inovex Academy

inovex Content Pool

Alle Tech-Vorträge im Content Pool

Hier geht's zu den Vorträgen