data.table mit R

Für Data Scientists, die mit R große Datenmengen effizient analysieren wollen

Termine Offene Schulungen


    02.10.2020


Lernziele und Agenda

  • Übersicht über das Paket data.table 
  • Verwenden von data.table- statt data.frame-Objekten 
  •  Die verschiedenen Möglichkeiten von data.table kennenlernen und einsetzen können

  • Grundlagen 
  •  Auswahl von Spalten 
  •  Auswahl von Gruppen 
  • Chaining 
  • Erzeugung von subsets 
  • Die Nutzung von := 
  • Die set()-Funktion 
  • Indexing 
  • Keys 
  • Rolling Joins

Inhalt

Eine Schwachstelle von R stellt der Umgang mit größeren Datensätzen dar. In R importierte Datensätze werden immer komplett in den Arbeitsspeicher geladen. Auch wird die Performance beim Umgang mit großen Datensätzen schlecht. 

Hier bietet das Paket data.table Lösungsmöglichkeiten. Statt eines data.frame-Objekts kann das data.table-Objekt verwendet werden. Mittels geeigneter Funktionen können so Daten schneller eingelesen und auch ausgeschrieben werden. Weiter existieren zahlreiche Datenmanipulationsmöglichkeiten, die weit über das hinausgehen, was mit data.frame-Objekten möglich ist. Hinzu kommt noch ein erheblicher Performance-Gewinn. 

 In diesem eintägigen Seminar werden alle notwendigen Schritte und Funktionen des data.table-Pakets vermittelt. Alle Schritte werden direkt in R (RStudio) umgesetzt, so dass ein nahtloses weiterarbeiten nach Beendigung des Seminars ohne weiteres gelingen sollte.

OFFENE SCHULUNG

Veranstaltungsort: Wiesbaden

€650,00
pro Person, zzgl. 19% MwSt

  • Schulungsrechner mit installierter aktueller Software, alle notwendigen Kursunterlagen Vollverpflegung während der Schulung inkl. Getränken (leckerer Kaffee und Tee; erfrischendes Wasser), beste Auswahl an Süßigkeiten sowie reichhaltiges Mittagessen.
  • Kursdauer: 1 Tag (9:30 - 16:00)
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de

INHOUSE-SEMINAR

Die Inhouse-Seminare lohnen sich bereits ab 2 Interessenten.

1.290,00
pro Tag bis 4 Teilnehmer zzgl. 19% MwSt

  • Alle Inhalte der Inhouse-Seminare werden individuell zugeschnitten und zielgruppenspezifisch vermittelt.
    Intensive Nachbetreuung ermöglicht den Teilnehmern ihre Kenntnisse in kürzester Zeit umzusetzen
    .
  • Empfohlene Seminardauer: 1 Tag
  • Leihgebühren Schulungsnotebook (auf Wunsch): 35,- Euro (pro Tag, pro Schulungsrechner)
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de

VIRTUELLEs KLASSENZIMMER

Ideal für das Home-Office oder dezentrale Arbeitsgruppen

Inhouse oder offene Schulung
gleiche Preise - gleicher Service
Weniger Aufwand

  • Bei Seminaren in unserem virtuellen Klassenraum nutzen Sie Ihre eigenen Rechner und erhalten von uns den gleichen Service in der gleichen
    hohen Qualität bei weniger Aufwand!
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de

Hintergrundinformationen zu R

Sie wollen, ehe Sie ein R Seminar buchen, etwas mehr erfahren, was R ist und kann? R ist eine Programmiersprache, die unter der GNU-Lizenz veröffentlich wurde. Hauptaugenmerk der Sprache liegt auf der Umsetzung statistischer Analysen und der effizienten Erstellung von Grafiken. Historisch ist R aus der (proprietären) Programmiersprache S entstanden, weswegen die beiden in weiten Teilen sehr ähnlich sind. Nachdem R über Jahre vorwiegend im Hochschulbereich eingesetzt wurde, wird seine Leistungsfähigkeit vor allem im Bereich der Data Science sehr geschätzt. Durch über 600 Zusatzpakete (Stand Ende 2019) sind nahezu alle bekannten statistischen Verfahren und Darstellungsmethoden verfügbar. R kann problemlos auf allen gängigen Plattformen (MS Windows Vista/7/8/Server 2008/10, Mac OS X, Linux Redhat/Debian/sus/ubuntu) installiert werden. Mit der Installation von R wird zugleich auch eine Programmierumgebung installiert. Die meisten Anwenderinnen und Anwender verwenden jedoch RStudio® um R möglichst komfortabel zu nutzen. Auch RStudio® ist für fast alle gängigen Betriebssysteme verfügbar und steht in zwei verschiedenen Varianten zur Verfügung. Neben den freien Desktop und Server-Installationen stehen noch kostenpflichtige Angebote zur Verfügung, die darüber hinaus besseren Service und Dashboards und Systeme zur Projektorganisation bereitstellen. Hier finden Sie eine Übersicht über die Unterschiede der einzelnen Systeme. Für die R Seminare die masem training anbietet wird im Regelfall auf die freie Desktop-Installation von RStudio® zurückgegriffen. Shiny® von RStudio® ermöglicht es zudem komfortabel R-basierte Applikationen zu entwickeln, die eine interaktive Datenanalyse für die Betrachter ermöglichen. So können interaktive Grafiken Ihre Daten schnell und aussagekräftig visualisieren oder mit Widgets Tabellen so konstruiert werden, wie sie für die aktuelle Aufgabe benötigt werden.