Grundlagen Apache Spark®

Für alle, die mit Apache Spark® in die Data Science einsteigen wollen.

Lernziele und Agenda

  • Aufbau und Grundlagen eines Apache Spark®-Systems 
  • Typische Arbeitsschritte in Apache Spark® mittels Python® in Jupyter® umsetzen

  • Big Data, Data Science, Hadoop® und Apache Spark®
  • Grundlagen Apache Spark® 
  • Data Management (Strukturierte, semi-strukturierte und unstrukturierte Daten) RDDs 
  • Exploratory Data Analysis and Data Quality 
  • Machine Learning

Inhalt

In diesem 1-tägigen Crash-Kurs lernen Sie Apache Spark® kennen. Apache Spark stellt eine Alternative zu Hadoop® dar. Gegenüber Hadoop® bietet Apache Spark® – in Abhängigkeit von der vorhandenen Hardware – Performance-Vorteile. Ein weiterer Vorteil ist, dass Apache Spark® auch direkt in bestehenden Hadoop®-Systemen genutzt werden kann. 

Ein zentraler Vorteil von Apache Spark® ist, dass es sich direkt mittels Python® programmieren lässt. Viele im Data Science Bereich tätige können Python®, so dass direkt mit Apache Spark® gearbeitet werden kann. Weiter kann durch den Einsatz von Jupyter® auch eine gute Dokumentation der durchgeführten Arbeiten erreicht werden. 

Der Schwerpunkt im Seminar liegt dabei auf den Grundlagen, die an einem praktischen System erlernt werden: Wir stellen Ihnen ein virtuelles Hadoop®-System mit Apache Spark® Installation (und Jupyter®) während der Schulung zur Verfügung, dass aus einem Master sowie zwei Slave-Knoten besteht. Sie können also bereits während der Veranstaltung Jobs auf Datenbeständen laufen lassen, die über mehrere Rechner verteilt sind.

INHOUSE-SEMINAR

Die Inhouse-Seminare lohnen sich bereits ab 2 Interessenten.

1.290,00
pro Tag bis 4 Teilnehmer zzgl. 19% MwSt

  • Alle Inhalte der Inhouse-Seminare werden individuell zugeschnitten und zielgruppenspezifisch vermittelt.
    Intensive Nachbetreuung ermöglicht den Teilnehmern ihre Kenntnisse in kürzester Zeit umzusetzen
    .
  • Empfohlene Seminardauer: 1 Tag
  • Leihgebühren Schulungsnotebook (auf Wunsch): 35,- Euro (pro Tag, pro Schulungsrechner)
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de

VIRTUELLEs KLASSENzimmer

Ideal für das Home-Office oder dezentrale Arbeitsgruppen

€1.290,00
pro Tag bis 4 Teilnehmer zzgl. 19% MwSt

  • Bei Seminaren in unserem virtuellen Klassenraum nutzen Sie Ihre eigenen Rechner und erhalten von uns den gleichen Service in der gleichen
    hohen Qualität bei weniger Aufwand!
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de