HERZLICH WILLKOMMEN IM BEREICH DATA SCIENCE TRAININGS!

!! JETZT NEU !!
Seminare im virtuellen Klassenzimmer

Alle Seminare auch in unserem virtuellen Klassenzimmer!
4 oder 8  x 90 Minuten

Termine für Firmen nach Absprache
Offene Schulungen zu festen Terminen

Selbstverständlich an Ihre Bedürfnisse angepasst und mit einem
unserer professionellen Dozenten - Kein Selbststudium!

Wählen Sie hier Ihr Wunschseminar aus!

Mit einer Vielzahl von Trainings unterstützen wir Sie dabei, Ihre Data Science Probleme noch effizienter zu lösen! Neben Seminare in Data Science mit R und IBM SPSS Modeler® bieten wir nachfolgend auch Seminare zu den speziellen Data Science Plattformen Hadoop® und Apache Spark® an

Alle unsere Statistik Seminare nach Softwares geordnet finden Sie hier

Selbstverständlich passen wir die Inhalte aller Seminare und Fortbildungen an Ihre betrieblichen Anforderungen an - "tailor made statistical education"!
Bei Inhouse Seminaren können Sie selbstverständlich Daten zur Verfügung stellen, mit denen das Seminar durchgeführt werden soll.

Unsere Offenen Schulungen finden garantiert statt!
Vergessen Sie die schlechten Erfahrungen, die sie mit den Absagen mangels Teilnehmern gemacht haben!

Data Science mit R

Data Science mit IBM SPSS Modeler®

Data Science Systeme

Manchmal ist ein Seminar nicht das geeignete Format um sich einem Problem zu nähern. Bei konkreten Fragestellungen rund um den Bereich Data Science unterstützen wir Sie auch als Projektpartner für bestimmte Fragestellungen oder begleiten Ihre Analysen ganz allgemeine im Rahmen von Coachings. 

Für weitere Informationen verwenden Sie bitte unser Kontaktformular oder rufen Sie uns an: 0611 531 500 91.

Nachfolgend haben wir einige interessante, nützliche und hoffentlich hilfreiche Informationen zu den verschiedenen Systemen und ihren Einsatzgebieten zusammengestellt. Diese Darstellung zu lesen, lohnt sich vor allem dann, wenn Sie noch nicht genau wissen, welche Software Sie für Ihre Aufgaben nutzen möchten.

Data science mit r

Von Statistikern für Statistiker entwickelt wurde die Programmiersprache R und bietet Ihnen topaktuelle Statistik in maximalem Funktionsumfang. Die freie Programmiersprache R  ist neben Python® die am meisten genutzte Open-Source-Software zur Lösung von Aufgaben im Bereich Data Science.
Data Science in R durchzuführen hat den Vorteil, dass Sie auf nahezu alle bekannten statistischen Verfahren zugreifen können. Neue Verfahren werden oft direkt in Form eines R-Pakets frei zur Verfügung gestellt. Bei proprietären Softwares dauert es oft bis zur nächsten Version, bis neue Verfahren implementiert sind. Verfahren die nur für einen kleinen Kreis von Nutzerinnen und Nutzern relevant sind, werden häufig erst sehr lange Zeit nach Veröffentlichung oder sogar nie in diese Tools aufgenommen.
Data Science in R zu rechnen, bietet also den Vorteil extremer Aktualität und statistischer Leistungsfähigkeit. Kehrseite der Medaille ist aber, dass nicht jedes statistische R - Paket - also jedes statistische Verfahren - für jede R-Version verfügbar oder nutzbar ist. Dies bedeutet, dass Sie R manchmal in mehreren Versionen nutzen um die volle Leistungsfähigkeit abzurufen. Der Aufwand R zu administrieren ist daher mithin etwas höher als bei proprietären Statistik Softwares. Gerade im Bereich Data Science mit R ist weiter zu beachten, dass die Pakete oft von Nicht- Informatikern programmiert wurden. Die Performance, und das ist bei Big Data Projekten durchaus relevant, ist daher manchmal eher schlecht.
Für etliche Funktionen stehen jedoch mehrere Pakete zur Verfügung, sodass an dieser Stelle ein Performance-Test (auf Sample-Daten) sinnvoll sein kann. Einen großen Sprung nach vorn hinsichtlich der Performance stellte die Nutzung von data.table in R anstelle von data.frame dar. In einem Eintages-Seminar zu data.table bringen wir Ihnen dieses äußerst leistungsfähige Tool zum Handling von Big Data in R näher.

RStudio®

 In unseren Seminaren nutzen wir die Programmierumgebung RStudio® um Statistik mit R zu rechnen. RStudio® unterstützt uns nicht nur mit den einschlägigen Programmierhilfen (Auto-Vervollständigung, markierte Klammern etc.). RStudio® erleichtert auch die Administration von Paketen erheblich und stellt uns verschiedene Exportfunktionen unkompliziert zur Verfügung. Unsere Seminare verstehen sich daher zugleich RStudio Seminare. Wir bieten für alle Interessierten das passende Seminar. Während sich der Grundkurs R und der Kompaktkurs R eher an Ein- und Wiedereinsteigende richten, bieten wir vier Seminare zur Data Science in R an. Diese richten sich an Interessierte, die sich in der Welt von R bereits etwas auskennen und tief(er) in die Welt der Data Science einsteigen möchten. Was genau wir bei masem unter Data Science verstehen, erfahren Sie in unserem Data Science Projektbereich. Oder Sie kontaktieren uns für weitere Informationen Einen Spezialfall stellt unser Kompaktkurs Auswertungen in der Medizin mit R dar. Dieser Kurs beschäftigt sich mit einschlägigen Analyseverfahren der Medizin (Gruppenvergleiche, Zusammenhangs- und Kontingenzanalysen etc.). Dieser R Kurs richtet sich vorwiegend an medizinisches Fachpersonal, denn nicht nur die Methoden, sondern auch die verwendeten Beispiele entstammen allesamt dem medizinisch-pharmazeutischen Kontext. Die Vielzahl graphischer Darstellungsmöglichkeiten die R bietet, werden in einem besonderen Seminar zu Graphics in R beleuchtet. Mit lattice und ggplot2 lernen sie in diesem Eintages-Seminar, wie Sie mit R Graphiken sicher, schnell und optimal angepasst erstellen. So wird auch die Umsetzung eines Corporate Designs in R zu Kinderspiel!

Vom 1 tägigen Grundkurs bis zu Seminaren zur Programmierung in R bilden wir Sie auf jeder Stufe des Könnens zielgerichtet und didaktisch kompetent fort. Selbstverständlich begleiten wir Sie auch gerne im Rahmen von Coaching bei Ihrer Arbeit in der Welt der Statistik mit R oder konzipieren vollständige R-Projekte für Sie.


Data Scence mit dem IBM SPSS Modeler®

Der IBM SPSS Modeler® stellt ein Flow-basiertes Tool zur Durchführung von Data Science Projekten dar: die einzelnen Analyseschritte werden durch Knoten dargestellt und entsprechend des Analyseprozesses verbunden. So gibt es u.a. Importknoten für den Datenbezug, Prozessknoten für die Datenvorbereitung oder auch Analyseknoten für die Modellierung. Durch diese Art der Modellierung wird aufeiner Oberfläche ein Modell erstellt, das auch für Nicht-Data-Scientists verständlich ist und die Kommunikation als auch Akzeptanz der Modelle erhöht. 

Sie wollen strukturiert entlang des CRISP-DM-Prozesses arbeiten?
Ein wesentlicher Vorteil des IBM SPSS Modelers® ist die konsequente Implementierung des CRISP-DM-Prozesses im Tool. Dadurch ist ein strukturiertes Arbeiten möglich, dass die Wahrscheinlichkeit für die erfolgreiche Durchführung eines Data Science-Projekts noch einmal erhöht. So können einzelne Streams (Stream ist die Bezeichnung für einen abgebildeten Analyseprozess, z.B. bestehend aus Datenimportknoten, Filterknoten, Transformationsknoten und Analyseknoten) den einzelnen Stufen des CRISP-DM-Prozesses zugeordnet werden: Dient ein Stream zuerst einmal dem Kennenlernen der Daten, so kann der Stream dem Bereich Data Understanding zugeordnet werden, dient der Stream der Analyse, so wird der Stream der Modellierungsstufe zugeordnet, Transformationen dem Bereich Data Preparation etc. 


Zahlreiche Modellierungsverahren: 

Der IBM SPSS Modeler® unterstützt zahlreiche Modellierungsverfahren, die häufig im Bereich des Data Science eingesetzt werden: Neben Regressionsmodellen werden Bäume (rekursives Partitionieren) u.a. unterstützt. Black-Box-Verfahren wie die Support Vector Machine,Neuronale Netze, Random Forests u.a. gehören zum Funktionsumfang. Für das Optimieren der Modelle stehen Boosting und Bagging zur Verfügung. Hyperparameter-Tuning kann mit Automatischen Analyseknoten durchgeführt werden.


Skripting mit Python® und R:

Um die Flexibilität des IBM SPSS Modelers® weiterzu erhöhen, stehen mit Python® und R zwei im Data Science Umfeld stark eingesetzte Sprachen zur Verfügung. Mit Python® können einzelne Streams gesteuert werden, aber auch mehrere Streams kaskadiert ausgeführt werden. R und Apache Spark® können in sogenannten Extension Nodes auch in den Streams selbst eingesetzt werden. Soll zum Beispiel ein exotisches Modell eingesetzt werden, das als R-Paket zur Verfügung gestellt wird– kein Problem! Dies gelingt einfach mit einem Erweiterungsknoten. Durch die Integration von Apache Spark™ können auf die Bearbeitung von großen Datenmenge optimierte Algorithmen genutzt werden.


Automatisierung und Wiederverwendbarkeit: 

Aufgrund der besonderen Struktur der Analysen in Streams ist es sehr gut möglich, wiederkehrende Analysen zu automatisieren. Streams können automatisiert zu bestimmten Zeiten ausgeführt werden, so können z.B. nachts zentrale Geschäftsvorgänge des Vortags analysiert werden. Die Ergebnisse stehen dann am nächsten Tag für das Reporting zur Verfügung. Wächst der Umfang an Streams in einer Firma, so kann durch den Collaboration and Deployment Server (CADS) eine Automatisierung der Ausführung der Streams erreicht werden. Wenn die Ausführung eines Streams fehlgeschlagen oder gelungen ist werden Sie automatisch (z.B. per Email) darüber informiert. Dies erlaubt eine besonders effiziente Nutzung von Rechenkapazitäten und Arbeitszeit. 


Kundenzuschnitt: 

Aufgrund der individuellen Anwendungsgebiete und damit einhergehenden Anforderungen an Seminare zu dieser SPSS Data Mining Software passen wir die Seminarinhalte gerne den Wünschen unserer Kunden an - im Regelfall ohne Mehrkosten!


Grundsätzlich bieten wir zwei IBM SPSS Modeler® Seminare an. So lernen Sie das Data Mining entweder grundlegend kennen oder vertiefen Ihr Wissen zum Data Mining im IBM SPSS Modeler®. Im Vordergrund stehen neben der Bereitstellung der Daten ausentsprechenden Datenbanksystemen und deren Aufbereitung die Definition von Analyseknoten und die graphische Darstellung. Dort wo es sinnvoll ist, orientieren sich die Modeler® Seminare am CRISP-DM Standard.

Auch der SPSS Modeler® bietet die Möglichkeit zur R Integration und zur Python® Integration. Gerne demonstrieren wir, wie Sie durch die Nutzung dieser Programmiersprachen effizienter arbeiten können.