Seminare & Workshops
Verarbeitung, Modellierung und Reporting in R
> SEMINARE & WORKSHOPS   >  Verarbeitung, Modellierung und Reporting in R
Datenverarbeitung, statistische Analysen und Modelle sind ein wesentlicher Bestandteil von Entscheidungsprozessen in Unternehmen. Und die Bedeutung für die Steuerung von Geschäftsprozessen nimmt immer weiter zu.
Die Herausforderungen für eine effiziente und robuste Analyse- und Modelllandschaft sind
- die durchgehend reproduzierbare Entwicklung und integrierte Anwendung.
- die wartbare als auch flexible Umsetzung inkl. Dokumentation.
- die direkte Vernetzung von Datenanalysten und Entscheidungsträgern.
- die stringente prozessuale Anbindung.
Realität:
Basieren Ihre Analysen und Modelle auf
- einer Vielzahl von undokumentierten Excel-Dateien?
- historischen Daten mit unklarer Herkunft und fragwürdiger Datenqualität?
- manuellen Schritten, die Sie nicht reproduzieren können?
Und erreichen Ihre Analyseergebnisse die Entscheidungsträger
- mittels manuell erstellter Berichte per Copy-Paste?
- mit großer Verzögerung?
- in statischen Reports ohne interaktive Drill-Down-Möglichkeiten oder semantischem Kontext?
Nach diesem Kurs sind Sie in der Lage, alle wichtigen Verarbeitungsschritte effizient und reproduzierbar mit der Programmiersprache R durchzuführen und Ihre Excel-Landschaft sukzessive abzulösen:
vom Datenimport über die Aufbereitung und die Analyse bis zur Prognose und Berichterstellung.
Die Verarbeitung wird vereinheitlicht und deutlich beschleunigt; der Code wird wartbar und testbar; die Prozesse werden einfacher zu dokumentieren und zu ändern.
Alle Informationen zu unserem Workshop „Verarbeitung, Modellierung und Reporting in R“ können Sie hier herunterladen:
Voraussetzungen
- Keine (bei Start ab Tag 1)
Umfang
- 4 Tage Vollzeit. Je nach Kenntnisstand und Interessensfokus können auch einzelne Tage gewählt werden.
Inhalt
Tag 1: Einführung in die Datenverarbeitung mit R
- Syntax (Pakete, Zuweisung, Funktionsdefinition) und Datentypen & -strukturen
- Daten einlesen mit readr und openxlsx
- Datenverarbeitung im tidyverse (dplyr, stringr, lubridate)
- Datenbanken anbinden mit DBI und dbplyr
- Plotten mit ggplot2
- Listenverarbeitung und Rekursion mit purrr
Tag 2: Strukturieren & Testen von Code; Dokumentation und Reporting
- Eigene Funktionen und R-Pakete erstellen
- Clean Code, Unittests & Dokumentation
- Versionskontrolle mit Git
- Transparente und reproduzierbare Analysen mit rmarkdown
- Erzeugen von Excel-Exports und PowerPoint-Reports mit officer
- Interaktive Dashboards mit shiny
Tag 3: Statistische Modellierung in R
- Überblick: Regression vs. Klassifizierung, Parametrisch vs. nicht-parametrisch, Überwachtes vs. unüberwachtes Lernen
- Nicht-lineare Optimierung
- Maximum Likelihood Schätzung
- Backtesting
Alternativen für Fortgeschrittene:
- Statistische Modellierung in caret
- Bayesian Inference mit stan
- Machine Learning mit keras
Tag 4: Capstone Projekt
- Intensiver, praktischer Recap:
- Wenden Sie Ihre erlernten Kenntnisse an und setzen Sie gemeinsam im Team ein reales Projekt erfolgreich um.
Umsetzung
- Der Fokus unserer Workshops liegt auf einer hohen Praxisorientierung
- Der komplette Kurs findet auf Basis interaktiver RMarkdown Notebooks statt.
- Von Anfang an werden die Teilnehmer am eigenen Code arbeiten.
- Der Kurs ist beispielorientiert: Alle Code-Beispiele sind aus der täglichen Arbeit in verschiedenen Unternehmen entnommen.
- Wir haben beim Erstellen des Kurses die Anwendungsbeispiele herausgesucht, die sich in jahrelanger Praxis immer wieder als besonders wichtig herauskristallisiert haben.