Kompaktkurs Data Science mit R

Seminar für Data Scientists die einen intensiven Einstieg in die Data Science mit R suchen.

Termine Offene Schulungen


20.08. - 22.08.2020 (Webinar)


Lernziele und Agenda

  • Data Science Projekte mit R umsetzen – basierend auf dem CRISP-DM-Standard 
  • Zentrale Data Science Pakete kennen und einsetzen können 
  • Das Framework caret nutzen können (+ Übersicht mlr-Framework) 
  • Größere Datenmengen mit data.table bearbeiten (+ weitere Alternativen) 
  • Zentrale Algorithmen im Data Science kennenlernen und einsetzen

  • Data Science Fundamentals 
  • Ressourcen: R, RStudio®, CRISP-DM 
  • Data IO: Datenbanken: RODBC-Schnittstellen, praktische Umsetzung mit MySQL; Effizientes Arbeiten mit größeren Datensätzen: Das data.table Paket 
  • Umsetzung von Data Science Projekten in R: Das caret Framework: Business Understanding (Hinweise); Data Understanding; Data Preparation; Modeling; Evaluation; Deployment 
  • Modellevaluation: ROC-Pakete; Relevante Parameter zur Modellbeurteilung 
  • Hadoop® und R - Grundlagen (bei Bedarf) 
  • Apache Spark® and R - Grundlagen (bei Bedarf)

Inhalt

Dieser Kurs richtet sich an alle Personen, die in die Umsetzung von Data Science Projekten mit R einsteigen oder ihr Wissen auffrischen wollen. Dabei sollten die TeilnehmerInnen bereits mit R gearbeitet und erste Erfahrungen gesammelt haben.  

In R® stehen zahlreiche Pakete zur Verfügung, die den gesamten Data-Science-Prozess - vom Datenzugriff und der Datenaufbereitung über die Bildung verschiedener Modelle bis hin zur Modellevaluation - unterstützen. 

Die einzelnen Schritte werden anhand des CRISP-DM-Standards praxisorientiert besprochen und auf Basis realer Fragestellung in R und RStudio® eingeübt. 

Um auch größere Datensätze verarbeiten zu können, wird das Paket data.table vertiefend trainiert. Weiter bietet das caret-Paket ein komplettes Framework zur Umsetzung an. Durch das caret-Paket kann auf über 230 Modellierungspakete zugegriffen werden. Um hier einen strukturierten Zugang zu finden, werden zentrale Modellierungstechniken vorgestellt und eingesetzt. Den Abschluss des Seminars bildet dann die Modellevaluation, für die in R und in den Zusatzpaketen zentrale Funktionen zur Verfügung stehen (Konfusionsmatrizen, ROC-Kurven, zentrale Kennwerte etc.). 

Eine autodidaktische Weiterbildung oder die Teilnahme an weiterführenden Seminaren ist nach diesem Grundkurs bestens möglich.

INHOUSE-SEMINAR

LEIDER KÖNNEN WIR MOMENTAN KEINE OFFENEN SCHULUNGEN IN WIESBADEN DURCHFÜHREN. NUTZEN SIE UNSER WEBINAR-ANGEBOT!

1.290,00
pro Tag bis 4 Teilnehmer zzgl. 19% MwSt

  • Alle Inhalte der Inhouse-Seminare werden individuell zugeschnitten und zielgruppenspezifisch vermittelt.
    Intensive Nachbetreuung ermöglicht den Teilnehmern ihre Kenntnisse in kürzester Zeit umzusetzen
    .
  • Empfohlene Seminardauer: 2 Tage
  • Leihgebühren Schulungsnotebook (auf Wunsch): 35,- Euro (pro Tag, pro Schulungsrechner)
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de

firmen webinar

Ideal für das Home-Office oder dezentrale Arbeitsgruppen

€990,00
pro Tag bis 4 Teilnehmer zzgl. 19% MwSt

  • Bei Seminaren in unserem virtuellen Klassenzimmer genießen Sie alle Vorteile der Inhouse-Seminare. Dabei nutzen Sie Ihre eigenen Rechner und erhalten von uns den gleichen Service in der gleichen hohen Qualität bei weniger Aufwand!
  • Kursdauer: Nach Absprache!
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de

Hintergrundinformationen zu R

Sie wollen, ehe Sie ein R Seminar buchen, etwas mehr erfahren, was R ist und kann? R ist eine Programmiersprache, die unter der GNU-Lizenz veröffentlich wurde. Hauptaugenmerk der Sprache liegt auf der Umsetzung statistischer Analysen und der effizienten Erstellung von Grafiken. Historisch ist R aus der (proprietären) Programmiersprache S entstanden, weswegen die beiden in weiten Teilen sehr ähnlich sind. Nachdem R über Jahre vorwiegend im Hochschulbereich eingesetzt wurde, wird seine Leistungsfähigkeit vor allem im Bereich der Data Science sehr geschätzt. Durch über 600 Zusatzpakete (Stand Ende 2019) sind nahezu alle bekannten statistischen Verfahren und Darstellungsmethoden verfügbar. R kann problemlos auf allen gängigen Plattformen (MS Windows Vista/7/8/Server 2008/10, Mac OS X, Linux Redhat/Debian/sus/ubuntu) installiert werden. Mit der Installation von R wird zugleich auch eine Programmierumgebung installiert. Die meisten Anwenderinnen und Anwender verwenden jedoch RStudio® um R möglichst komfortabel zu nutzen. Auch RStudio® ist für fast alle gängigen Betriebssysteme verfügbar und steht in zwei verschiedenen Varianten zur Verfügung. Neben den freien Desktop und Server-Installationen stehen noch kostenpflichtige Angebote zur Verfügung, die darüber hinaus besseren Service und Dashboards und Systeme zur Projektorganisation bereitstellen. Hier finden Sie eine Übersicht über die Unterschiede der einzelnen Systeme. Für die R Seminare die masem training anbietet wird im Regelfall auf die freie Desktop-Installation von RStudio® zurückgegriffen. Shiny® von RStudio® ermöglicht es zudem komfortabel R-basierte Applikationen zu entwickeln, die eine interaktive Datenanalyse für die Betrachter ermöglichen. So können interaktive Grafiken Ihre Daten schnell und aussagekräftig visualisieren oder mit Widgets Tabellen so konstruiert werden, wie sie für die aktuelle Aufgabe benötigt werden.