data.table mit R

Für Data Scientists, die mit R große Datenmengen effizient analysieren wollen

Termine Offene Schulungen


    02.10.2020


Lernziele und Agenda

  • Übersicht über das Paket data.table 
  • Verwenden von data.table- statt data.frame-Objekten 
  •  Die verschiedenen Möglichkeiten von data.table kennenlernen und einsetzen können

  • Grundlagen 
  •  Auswahl von Spalten 
  •  Auswahl von Gruppen 
  • Chaining 
  • Erzeugung von subsets 
  • Die Nutzung von := 
  • Die set()-Funktion 
  • Indexing 
  • Keys 
  • Rolling Joins

Inhalt

Eine Schwachstelle von R stellt der Umgang mit größeren Datensätzen dar. In R importierte Datensätze werden immer komplett in den Arbeitsspeicher geladen. Auch wird die Performance beim Umgang mit großen Datensätzen schlecht. 

Hier bietet das Paket data.table Lösungsmöglichkeiten. Statt eines data.frame-Objekts kann das data.table-Objekt verwendet werden. Mittels geeigneter Funktionen können so Daten schneller eingelesen und auch ausgeschrieben werden. Weiter existieren zahlreiche Datenmanipulationsmöglichkeiten, die weit über das hinausgehen, was mit data.frame-Objekten möglich ist. Hinzu kommt noch ein erheblicher Performance-Gewinn. 

 In diesem eintägigen Seminar werden alle notwendigen Schritte und Funktionen des data.table-Pakets vermittelt. Alle Schritte werden direkt in R (RStudio) umgesetzt, so dass ein nahtloses weiterarbeiten nach Beendigung des Seminars ohne weiteres gelingen sollte.

INHOUSE-SEMINAR

LEIDER KÖNNEN WIR MOMENTAN KEINE OFFENEN SCHULUNGEN IN WIESBADEN DURCHFÜHREN. NUTZEN SIE UNSER WEBINAR-ANGEBOT!

1.290,00
pro Tag bis 4 Teilnehmer zzgl. 19% MwSt

  • Alle Inhalte der Inhouse-Seminare werden individuell zugeschnitten und zielgruppenspezifisch vermittelt.
    Intensive Nachbetreuung ermöglicht den Teilnehmern ihre Kenntnisse in kürzester Zeit umzusetzen
    .
  • Empfohlene Seminardauer: 1 Tag
  • Leihgebühren Schulungsnotebook (auf Wunsch): 35,- Euro (pro Tag, pro Schulungsrechner)
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de

firmen webinar

Ideal für das Home-Office oder dezentrale Arbeitsgruppen

€990,00
pro Tag bis 4 Teilnehmer zzgl. 19% MwSt

  • Bei Seminaren in unserem virtuellen Klassenzimmer genießen Sie alle Vorteile der Inhouse-Seminare. Dabei nutzen Sie Ihre eigenen Rechner und erhalten von uns den gleichen Service in der gleichen hohen Qualität bei weniger Aufwand!
  • Kursdauer: Nach Absprache!
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de

Hintergrundinformationen zu R

Sie wollen, ehe Sie ein R Seminar buchen, etwas mehr erfahren, was R ist und kann? R ist eine Programmiersprache, die unter der GNU-Lizenz veröffentlich wurde. Hauptaugenmerk der Sprache liegt auf der Umsetzung statistischer Analysen und der effizienten Erstellung von Grafiken. Historisch ist R aus der (proprietären) Programmiersprache S entstanden, weswegen die beiden in weiten Teilen sehr ähnlich sind. Nachdem R über Jahre vorwiegend im Hochschulbereich eingesetzt wurde, wird seine Leistungsfähigkeit vor allem im Bereich der Data Science sehr geschätzt. Durch über 600 Zusatzpakete (Stand Ende 2019) sind nahezu alle bekannten statistischen Verfahren und Darstellungsmethoden verfügbar. R kann problemlos auf allen gängigen Plattformen (MS Windows Vista/7/8/Server 2008/10, Mac OS X, Linux Redhat/Debian/sus/ubuntu) installiert werden. Mit der Installation von R wird zugleich auch eine Programmierumgebung installiert. Die meisten Anwenderinnen und Anwender verwenden jedoch RStudio® um R möglichst komfortabel zu nutzen. Auch RStudio® ist für fast alle gängigen Betriebssysteme verfügbar und steht in zwei verschiedenen Varianten zur Verfügung. Neben den freien Desktop und Server-Installationen stehen noch kostenpflichtige Angebote zur Verfügung, die darüber hinaus besseren Service und Dashboards und Systeme zur Projektorganisation bereitstellen. Hier finden Sie eine Übersicht über die Unterschiede der einzelnen Systeme. Für die R Seminare die masem training anbietet wird im Regelfall auf die freie Desktop-Installation von RStudio® zurückgegriffen. Shiny® von RStudio® ermöglicht es zudem komfortabel R-basierte Applikationen zu entwickeln, die eine interaktive Datenanalyse für die Betrachter ermöglichen. So können interaktive Grafiken Ihre Daten schnell und aussagekräftig visualisieren oder mit Widgets Tabellen so konstruiert werden, wie sie für die aktuelle Aufgabe benötigt werden.