masem research institute
data science

Wir lieben Sprints und Clean Code ist unsere Bibel!

Aus diesem Grund arbeiten wir agil und schaffen schnellen Nutzen durch Rapid Prototyping.
Mit aktuellsten Versionierungssystemen wie git und gitlab ist unsere Arbeit hochtransparent und durch die Nutzung von Amazon AWS und Microsoft Azure sind wir natürlich auch virtuell unterwegs.
Aufgrund unserer Forschungsaktivitäten sind wir dabei immer am Puls der Zeit.

Unsere Schwerpunkte

Besonders in drei Branchen unterstützen wir unsere Kunden in der Data Science

Industrie

  • Entwicklung von Applikationen zur Maschinenüberwachung
  • Analyse von Maschinendaten zur Identifikation von Gründen für Ausschüssen (Predictive Maintenance) und zur Reduktion der Ausschussquoten
  • Verbesserung der gefertigten Stücke.

Life Science

  • Real World Evidence in Data Science Projekten
  • Entwicklung von Data Science Applikationen
  • Aufbau von Data Science Teams
  • Potentialidentifikation für Data Science (Machine Learning) Applikationen und Qualitätssicherung
  • Unterstützung auch bei kleineren Studien.

Finanzen

  • Deep Learning zur Optimierung langfristiger Anlagestrategien
  • Entwicklung von intelligenten Applikationen mit Daten aus Bloomberg, Factset, andere Quellen.
  • Bereitstellung der Informationen in der gewohnten Microsoft Office Umgebung.

Daten sind das neue Öl und Informationen das neue Gold!
Schürfen Sie mit uns Gold aus Ihren Daten!

 „I keep saying the sexy job in the next ten years will be statisticians
Val Varian - Google chief economist - 2009

Er sollte Recht behalten: Heute werden in fast allen mittleren und großen Unternehmen Data Science Verfahren eingesetzt.
Mit diesem wachsenden Datenhandel wächst auch die Bedeutung der Data Science.

Daten nur zu haben, aber nichts damit zu machen, ist sinnlos - Um aus Daten Informationen zu machen, stehen wir als Data Scientists an Ihrer Seite!

Die zunehmende Bedeutung von Data Science versinnbildlicht am ehesten ein Blick auf das RedMonk Ranking der verwendeten Programmiersprachen. Python steht hier 2020 auf Platz 2, was vor allem am intensiven Einsatz in der Data Science liegt.
Und pünktlich zu Ihrem 20 Geburtstag klettert die freie Programmiersprache R um 2 Zähler auf Rang 13 im Ranking. Zugleich wurde der Release der neuen Version 4 angekündigt Von der Sprache der Wissenschaft wurde R also in kurzer Zeit zu einer der etabliertesten Sprachen der Data Science und steht Python in Sachen Wachstum kaum etwas nach!

Die Frage, ob nun R oder Python besser geeignet ist, umgehen wir durch die gemeinsame Nutzung:
Um für unsere Kunden die besten Informationen aus Ihren Daten herauszuholen, nutzen wir R und Python gemeinsam!

was für uns data science ist

Seit einigen Jahren wird der Begriff "Data Science" oftmals in Zusammenhang mit "Künstliche Intelligenz", "Maschinenlernen" und "Neuronale Netze" genannt.
Aber auch ganz allgemeine Begriffe wie "Business Intelligence" oder "Big Data" werden mit den Vorgenannten gerne vermischt, sodass ein unscharfes Begriffschaos entsteht, in dem sich viele Akteure bewegen und in dem man leicht den Überblick verlieren kann.

Die deutschsprachige Wikipedia bezeichnet mit Data Science "...generell die Extraktion von Wissen aus Daten".
Anders ausgedrückt, geht es grundsätzlich darum, mit Hilfe von Daten Fragen zu beantworten und Wissen zu generieren.
Doch weniger den Begriff "data", als vielmehr die "Science" bezeichnet Leek als das eigentlich Relevante.
Denn die Herausforderung besteht nicht darin, möglichst große Datenmengen ("Big Data") zu generieren, denn die Daten fallen nachweisbar durch immer mehr automatisierte Prozesse sowieso an. Hier ist an Industrie 4.0, an smart Life und Soziale Medien zu denken. Laut IBM stellen hierbei Transaktionen und Log-Files die größten internen Quellen und Soziale Medien und Audio-/Video- und Bilddaten die größten externen Datenquellen dar.

Die Herausforderung – und damit unsere Aufgabe – besteht im Zusammenspiel von Fragestellung, Daten und Methoden, die richtigen Entscheidungen zu treffen.