Rückblick auf das Summer Meetup der Kasseler useR Group

Bei hochsommerlichen Temperaturen in Kassel fand das Summer Meetup statt, das seinen Namen verdient hat. Die Kasseler useR Group hat sich getroffen um gemeinsam mit eoda Chief Data Scientist Oliver Bracht auf die useR! Conference 2016 in Stanford – die weltgrößte Konferenz für die Anwender der Statistiksprache R – zurück zu blicken.

„Rückblick auf das Summer Meetup der Kasseler useR Group“ weiterlesen

Die useR! Conference 2016 in Stanford: Ein Fazit

Der Zuschauerandrang war so groß wie noch nie: Bereits fünf Monate vor Beginn war die useR! Konferenz restlos ausverkauft. Im Vorfeld lag die Vermutung nahe, dass der Veranstaltungsort Stanford – mitten im Silicon Valley gelegen und nur einen Steinwurf von den dort ansässigen Technologiekonzernen entfernt – der Grund für die große Nachfrage ist. Das hat sich jedoch nicht bestätigt: Es waren nicht mehr Google, Facebook und Amazon Mitarbeiter unter den useR! Teilnehmern als in den vergangenen Jahren.

Über 800 Teilnehmer auf der Welcome Reception der useR! Conference 2016
Über 800 Teilnehmer auf der Welcome Reception der useR! Conference 2016

„Die useR! Conference 2016 in Stanford: Ein Fazit“ weiterlesen

Data Science mit R: Die Agenda der [R] Kenntnis-Tage 2016 ist online

Data Science goes professional. Die [R] Kenntnis-Tage 2016 bieten Fachanwendern, Datenanalysten, Entwicklern, Administratoren und IT-Entscheidern Einblicke in die vielfältigen Anwendungsfelder der Programmiersprache R. Die Veranstaltung findet am 2. und 3. November in Kassel statt.

[R] Kenntnis-Tage 2016 in Kassel
[R] Kenntnis-Tage 2016 in Kassel
Daten sind für Unternehmen aller Branchen zu einer maßgeblichen Ressource geworden und Data Science zur Schlüsselqualifikation, um das Potenzial darin zu erschließen. Die freie Programmiersprache R ist dabei weltweit eine der populärsten Lösungen für die Analyse und Visualisierung von Daten.

„Data Science mit R: Die Agenda der [R] Kenntnis-Tage 2016 ist online“ weiterlesen

Die useR! Conference 2016 in Stanford: Die Höhepunkte vom dritten Präsentationstag

Eingerahmt von den beiden Keynotes von Deborah Nolan und Simon Urbanek bot auch der abschließende Tag der useR! 2016 interessante Talks, auf die wir im Folgenden eingehen.

Alex Cozzi: Gradient Boosted Trees Model: deploying R models into production environments

Alex Cozzi hat den useR! Teilnehmern erläutert, wie R bei eBay verwendet wird: Bei jeder Suchanfrage wird im Hintergrund ein Gradient Boosting Modell (GBM) ausgeführt. Aufgrund zahlreicher Vorteile, ist dieses Verfahren das derzeit beliebteste bei eBay:

  • State of the Art Performance
  • Die Variablen/Features müssen nicht metrisch sein
  • Die Modelle entdecken auch nicht-lineare Zusammenhänge
  • GBM ist relativ robust gegen overfitting
  • Mit Variable Importance- und Dependency-Plots lässt sich die Bedeutung der eingegangenen Variablen bestimmen. GBMs können somit nicht nur zur Prognose, sondern auch zur Erklärung herangezogen werden.

„Die useR! Conference 2016 in Stanford: Die Höhepunkte vom dritten Präsentationstag“ weiterlesen

eRum 2016: Die erste europäische Konferenz für die Programmiersprache R

Die europäische Community der Statistiksprache R hat eine neue Anlaufstelle zum Erfahrungsaustausch und zum Vernetzen. Die Poznan University of Economics and Business veranstaltet vom 12. bis 14. Oktober in Polen erstmals das european R users meeting (eRum). 250 Teilnehmer aus Wirtschaft und Wissenschaft werden zu der Veranstaltung in Posen erwartet.

eRum2016: Europäische Konferenz für die Entwickler und Anwender von R
eRum2016: Europäische Konferenz für die Entwickler und Anwender von R

Meeting of R heroes

„eRum 2016: Die erste europäische Konferenz für die Programmiersprache R“ weiterlesen

Die useR! Conference 2016 in Stanford: Die Highlights vom zweiten Präsentationstag

Genau wie der erste Präsentationstag der useR! 2016, hatte auch der zweite Tag interessante Sessions mit Neuerungen für die R-Nutzer zu bieten.

Derek Damron: Empowering Business Users with Shiny

Derek Damron von Allstate Ensures berichtete, wie in seinem Unternehmen Business User mit Shiny in die Lage versetzt werden, Analysen selbständig durchzuführen. Folgende Gründe hat er für die Einführung von Shiny angeführt:

  • Unterstützung beim Entscheidungsfindungsprozess
  • Verbesserung der Beziehung zwischen Data Science und Business-User
  • Erhöhung der Transparenz
  • Einführung von Feedbackschleifen

„Die useR! Conference 2016 in Stanford: Die Highlights vom zweiten Präsentationstag“ weiterlesen

Die useR! Conference 2016 in Stanford: Keynote Simon Urbanek

Simon Urbanek hat in der abschließenden Keynote der useR! Conference 2016 mit RCloud ein vielversprechendes Projekt vorgestellt, das neue Optionen für die Verwendung von R im Backend bietet.

Simon Urbanek während seiner Präsentation zum Thema RCloud
Simon Urbanek während seiner Präsentation zum Thema RCloud

Simon Urbanek: RCloud – Collaborative Environment for Visualization and Big Data Analytics

Die Daten und die Analysen werden in die Cloud verlegt, RCloud ist vollständig browserbasierend. Die User müssen R nicht lokal installiert haben. Dadurch wird das Paket- und Dependency-Management erheblich vereinfacht.

„Die useR! Conference 2016 in Stanford: Keynote Simon Urbanek“ weiterlesen

Die useR! Conference 2016 in Stanford: Keynote Deborah Nolan

Welche Defizite gibt es in der Lehre und wie vermittelt man in Zukunft Data Science und Statistik – diesen spannenden Fragen hat sich Deborah Nolan in ihrer Keynote am vierten und damit letzten Tag der useR! 2016 gewidmet.

Deborah Nolan während ihrer Keynote zur Lehre von Statistik und Data Science
Deborah Nolan während ihrer Keynote zur Lehre von Statistik und Data Science.

Deborah Nolan: Statistical Thinking in a Data Science Course

Deborah Nolan von der University of California hat zunächst den Begriff „Data Science“ definiert:

Die Gewinnung, Aufbereitung und vollständige Analyse von Daten inklusive der Kommunikation der aus der Analyse abgeleiteten Ergebnisse.

„Die useR! Conference 2016 in Stanford: Keynote Deborah Nolan“ weiterlesen

Die useR! Conference 2016 in Stanford: Keynote von Daniela Witten

Den dritten Tag der useR! Conference 2016, den Hadley Wickham mit seinem Beitrag eröffnet hatte, rundete Daniela Witten mit ihrer Keynote ab.

Daniela Witten von der University of Washington mit ihrem Vortrag auf der useR! 2016.
Daniela Witten von der University of Washington mit ihrem Vortrag auf der useR! 2016.

Daniela Witten: Flexible and Interpretable Regression Using Convex Penalties

Gut geeignet für Prognosen oder leicht zu interpretieren: Diesen beiden Eigenschaften lassen sich viele Data Mining Modelle zuordnen. Neuronale Netze sind zum Beispiel selbst unter Einbeziehung nicht-linearer unabhängiger Variablen für Prognosen geeignet, Regressionsmodelle oder Klassifikations- und Regressionsmodelle hingegen sehr gut zu interpretieren.

„Die useR! Conference 2016 in Stanford: Keynote von Daniela Witten“ weiterlesen

Die useR! Conference 2016 in Stanford: Keynote von Hadley Wickham

RStudio Chief Scientist Hadley Wickham hat mit seiner mit Spannung erwarteten Keynote Tag 3 der useR! Conference 2016 eingeleitet.

Hadley Wickham: Einer der Keynote Speaker der useR! 2016
Hadley Wickham: Einer der Keynote Speaker der useR! 2016

In seinem Vortrag hat Hadley Wickham zunächst den typischen Data Science Workflow mit folgenden Schritten beschrieben:

„Die useR! Conference 2016 in Stanford: Keynote von Hadley Wickham“ weiterlesen