Absatz mit Fachliteratur zu R um 127% gestiegen

O’Reilly Media führt R nun als „Major Programming language“ und ermittelt überdurchschnittliches Wachstum für Fachbücher zu R.

Jährlich veröffentlicht der amerikanische Verlag O’Reilly Media, einen Report über den amerikanischen Markt für IT-Fachbücher. Die Absatzdaten bezieht O’Reilly Media von dem Marktforschungsinstitut Nielsen. Daraus geht hervor, dass der Gesamtmarkt für Bücher zu Programmiersprachen in 2011 um 1,15% auf 6,4 Mio. Exemplare angestiegen ist.

Für R wurde in 2011 ein Absatz von 20tsd Büchern festgestellt, im Vergleich zu 11tsd in 2010. Dies entspricht einem Wachstum von 76%. Dadurch landet R in der Liste der „Major Programming Languages“, der Kategorie mit Absatzzahlen von 10 – 50tsd. Büchern. In dieser Kategorie befinden sich unter anderem auch Visual Basic, Ruby oder Perl. Zum Vergleich – die Kategorie der „Large Programming Languages“ wird von Java mit 250tsd Stück angeführt.

Auf Quartalsebene betrachtet zeigt sich die Dynamik um R noch deutlicher. Nachfolgende Grafik vergleicht das letzte Quartal 2010, mit dem letzten Quartal 2011. Grüne Flächen stehen für einen Absatzanstieg, Rote für einen Rückgang. Je heller eine Farbe desto stärker die Veränderung. Mit einer positiven Veränderung von 127%, gehört R zu den besonders grün leuchtenden Flächen.

Quelle: O’Reilly

O‘Reilly sieht diese Daten auch als einen Indikator für die tatsächliche Verbreitung der Programmiersprachen. Es kann sicher unterstellt werden, dass die Nachfrage nach Literatur zu R, das gestiegene Interesse an  „Big Data“ widerspiegelt. Ist doch R die Sprache der Wahl, zur Analyse großer Datenbestände.

Die Bedeutung dieses Trendindikators verstärkt sich noch einmal, wenn man sich die Menge des frei verfügbaren Materials für R, sowie die Rolle der R-Community vor Augen führt. Unter http://pairach.com/2012/02/26/r-tutorials-from-universities-around-the-world/ hat Pairach Piboonrungroj beispielsweise eine Liste frei verfügbarer Tutorials zusammengestellt. Bei Robert München auf http://r4stats.com/articles/popularity/ kann man eindrucksvoll sehen, welche Bedeutung die Community für R hat.

Die Clusteranalyse in der Kundensegmentierung

Das Marktumfeld, in dem sich die meisten Unternehmen heute bewegen, ist gekennzeichnet durch Produkte und Leistungen, die zunehmend austauschbar werden und Innovationzyklen, die – getrieben durch den internationalen Wettbewerb – immer schneller werden. Eine möglichst gezielte Ansprache der Kunden gilt als ein Erfolgsrezept, um in diesem Umfeld die Kundenbindung zu erhöhen und neue Kunden zu gewinnen. Die Eigenschaften, die die Kunden charakterisieren, sind allerdings vielschichtig. B2C-Kunden sind nicht nur groß oder klein, alt oder jung, blond oder schwarz B2B-Kunden lassen sich nur in die Schulbladen Industrie oder Handel, groß oder klein einsortieren. Multivariate Verfahren berücksichtigen diese Vielfältigkeit der Merkmale und helfen dabei, die Realität möglichst passend abzubilden. Die Clusteranalyse ist eines der multivariaten Verfahren.

Die Aufgabenstellung im Vertrieb ist schon immer komplex

Marketing und Vertrieb sehen sich einem komplexen Set von Aufgaben gegenüber, um die Kunden optimal zu betreuen:

  • Verständnis von Kunden verbessern.
  • Abgegrenzte homogene Gruppen valide und nachvollziehbar beschreiben.
  • Passende und zielgerichtete Maßnahmen und Ansprachen für homogene Gruppen entwickeln.
  • Streuungsverluste und Missverständnisse minimieren.
  • Optimale Kosten-Nutzen-Relation in der Kommunikation.
  • Gegenseitiges Verständnis und Bindung fördern.
  • Customer-Lifetime-Value Modelle entwickeln und verbessern.
  • Fundierte Bewertung von Potenzialen und Risiken

Tante Emma kannte Ihre Kunden, Ihren Wettbewerb und Ihre Produkte sehr gut. Sie hat den Spagat, all diese Anforderungen abzudecken, ganz gut hinbekommen.

Heute stellen diese Anforderungen eine große Herausforderung für nahezu alle Unternehmen dar. Dabei liegen oft vielfältige Daten in Form von unstrukturierten oder strukturierten Informationen vor, die für eingehende Analysen herangezogen werden könnten.

Die Clusteranalyse findet und ähnliche Objekte

Die Clusteranalyse findet und trennt ähnliche Objekte

Nutzen der Clusteranalyse

Die Clusteranalyse hilft bei der Analyse der Kunden und liefert im Ergebnis homogene Kundengruppen. Dabei werden alle Aspekte ganzheitlich betrachtet werden und es erfolgt keine Vorauswahl durch eine Fokussierung auf vermeintliche Kernaspekte wie bspw. Branche, Größe oder Haarfarben. Im Ergebnis ist entscheidend, wie sich die verschiedenen unterschiedlichen Merkmale zueinander verhalten: Umsatzwachstum zu Branchenausrichtung, Branche zu Lösungsportfolios, Portfolio zu Größe, Größe zu Personalqualifikation, Qualifikation zu Region, Region zur Entwicklung des Unternehmens, usw.

Ablauf einer Clusteranalyse

Ablauf einer Clusteranalyse

Welche Bedeutung haben diese Zusammenhänge für das gesamte Bild?

Nutzen einer Clusteranalyse

  • Die Homogenität innerhalb der Cluster ermöglicht eine präzise Charakterisierung.
  • Die Heterogenität zwischen den Gruppierungen sorgt für Trennschärfe.
  • Die Cluster lassen sich auf alle vorhandenen Variablen projizieren, z.B.:
    • Unternehmen der Größe x gehören vor allem zum Cluster 1
    • Unternehmen des Cluster 2 finden sich vor allem in der Branche y usw.
  • Hoher ROI durch Nutzung und Veredelung bereits vorhandener Informationen, keine Kosten für die Datenerhebung.
  • Geringer finanzieller und personeller Aufwand in der Durchführung und somit geringes Projekt-Risiko.

Beispiel – Einsatz der Clusteranalyse für Marketingmaßnahmen

Durch die Auffindung und Beschreibung der Segmente kann eine passgenaue Marketingmaßnahme entwickelt werden, die auf die jeweiligen Schlüsselargumente ausgerichtet ist. Dadurch wird die Treffgenauigkeit und damit auch die Erfolgswahrscheinlichkeit erhöht. Kosten-Nutzen der Kampagne stehen in idealem Verhältnis.

Vorteile

  • Gezielte Ansprache
  • Hohe Ausschöpfung
  • Geringe Streuungsverluste
  • Ideales Kosten-Nutzen Verhältnis
  • Kunden fühlen sich verstanden

R ist eines der wichtigsten Werkzeuge im Daten Journalismus

Vergangenes Wochenende wurde, während der School of Data Jounalism des Internationalen Festivals für Journalismus, das Data Journalism Handbook vorgestellt. Daten Journalismus gewinnt vor allem in den USA oder dem Vereinigten Königreich immer stärker an Bedeutung. Im Gegensatz zum klassischen Journalismus, an dessen Anfang immer eine Geschichte steht (Story Driven Journalism), lässt der Daten Journalismus, Daten gewissermaßen die Geschichte erzählen.

Aus einer Idee während eines 48 stündigen Workshops, ist nun das Handbuch für Datenjournalisten entstanden. Ein kooperatives Werk verschiedener Journalisten, mit einer gemeinsamen Leidenschaft für Daten Journalismus. Zu den Autoren aus dem deutschsprachigen Raum gehören u. a. Sasha Venohr von Zeit Online (https://twitter.com/#!/venohr), Mirko Lorenz von der Deutschen Welle (http://twitter.com/#!/mirkolorenz) und Lorenz Matzat von OpenDataCity (http://twitter.com/#!/lorz).

Ein frühes Beispiel für Daten Journalismus ist die Pulitzer Preis prämierte Reportage über die 1967er Detroit Riots, von Philip Meyer. Den ursprünglichen Eindruck, dass die Aufständigen sich hauptsächlich aus Ärmeren Menschen der untersten Bildungsschicht und Farbigen aus dem Süden der Vereinigten Staaten zusammensetzten, widerlegte Meyer durch eine Umfrage. Diese ergab, dass eine Beteiligung, an den Aufständen von College Absolventen, genauso wahrscheinlich war, wie die von Highschool Abbrechern, die Beteiligung von Menschen aus dem Süden galt sogar als weniger wahrscheinlich.
Während Philip Meyer seine Reportage nur mit sehr beschränkten Hilfsmitteln erstellen konnte, wird heute die Arbeit von Daten Journalisten durch den technischen Fortschritt erheblich erleichtert. Daten sind zunehmend öffentlich und immer leichter zugänglich. Hier bieten Datenportale wie DataMarket einen guten Einstieg. Die Analyse von großen Datensätzen ist für moderne PCs kein Problem mehr, und das Internet ist eine riesen Erleichterung für die Recherche von Daten oder Zusammenhängen.

Aktuelle Beispiele für gelungenen Datenjournalismus
Eine bedeutende Rolle spielt der Data Blog des Guardians. Dort finden sich zahlreiche interessante Beispiele für Datenjournalismus, aufbereitet in ansprechenden Grafiken. Die passenden Daten dazu werden zusätzlich über den eigenen DataStore zugänglich gemacht.

In Deutschland findet sich auf Zeit Online mit dem Data Blog ein Blog der sich dediziert mit Daten Journalismus und Open Data auseinandersetzt.
Hervorstechende Beispiele für Deutschen Datenjournalismus sind u.a. der Zugmonitor der Süddeutschen Zeitung, die Fluglärmkarte der Taz oder auch die Aufbereitung des Spiegels, der von Wikileaks veröffentlichten U.S. Depeschen.

Für ihren Zugmonitor, erfasst die Süddeutsche Zeitung den kompletten Deutschen Fernverkehr in Echtzeit und visualisiert diesen ansprechend auf einer Deutschland Karte, Verspätungen werden farblich hervorgehoben.

R und Datenjournalismus
Ein Kapitel des, frei zugänglichen Handbuchs für Datenjournalisten, fragt nach den favorisierten Tools der Journalisten. Die Hälfte der Journalisten nennt R als eines der favorisierten Werkzeuge zur Analyse von Daten. Gregor Aisch von der Open Knowledge Foundation (http://twitter.com/#!/driven_by_data) hält R für das leistungsfähigste Tool, vor allem zur Analyse großer Datensets. Im Gegensatz zu Tabellenkalkulationen erlaubt R eine Scriptorientierte Arbeitsweise, anhand derer sich Vorgänge schnell und einfach reproduzieren lassen.

R kann die Journalisten bei allen notwendigen Schritten unterstützen. Von Bezug der Daten, über verschiedenste Quellen, die eigentliche Auswertung bis hin zu einer ansprechenden Visualisierung. eoda zeigt hier am Beispiel der Daten des Zugmonitors wie man offene Daten für eigene Zwecke mit R nutzen kann. Zu den Möglichkeiten der Visualisierungen mit R finden sich in älteren Posts Beispiele.

Erfolgreich genutzt wird R von der Redaktion der NY-Times. Nur Stunden nach dem Tod von Michael Jackson, veröffentlichte die NY-Times diese Grafik. Hier wird die Performance von Jacksons Liedern in den Billboard Top 100 abgebildet. Nach Aussage von Amanda Cox, Grafik Editor der NY Times wurde diese Anwendung vollständig in R erstellt.

 

Excel Reports mit R erstellen am Beispiel des Zugmonitors der SZ

Daten im Überfluss sind gleichzeitig Fluch und Segen unserer Zeit. Mit dem Zugmonitor hat die Süddeutsche Zeitung ein besonders anschauliches Projekt initiiert, das die Möglichkeiten und den Nutzen von „BigData“ aufzeigt. eoda erklärt in einem Screecast, wie man die Daten mit Hilfe R in Echtzeit für Excel-Nutzer aufbereiten kann.

Beim Zugmonitor wird aus den offiziellen Angaben der Bahn eine Live-Karte zu Verspätungen im Fernverkehr dargestellt. Zusätzlich werden die Rohdaten per API von OpenDataCity zur Verfügung gestellt. Dabei können beträchtliche Datenmengen zusammen kommen, denn pro Tag kann man hier die Daten für ca. 1000 Zugeinfahrten abfragen. Die Analyse dieser Rohdaten ist ein schönes Beispiel für „Business Analytics“. Man kann auf Basis dieser Daten verschiedenen Fragestellungen nachgehen:

  • Welche Muster gibt es in den Verspätungen?
  • Welche Häufungen gibt es in den Ursachen? Wann und auf welchen Strecken?
  •  Wie entwickeln sich die Verspätungen für Zeiträume, Orte oder Züge?

eoda setzt bei Datenanalyse auf R, die zur Zeit vermutlich mächtigste Sprachen zur umfassenden Datenanalyse, die gerade rapide an Verbreitung zunimmt. Dieser Trend wird aktuell dadurch untermauert, dass SAP scheinbar plant, seine „Predicitive Analytic Lösungen“ für R zu öffnen.

In einem Sreencast unter zeigen wir, welche Möglichkeiten sich R-Nutzern bieten, die Daten des Zugmonitors auszulesen, aufzubereiten und die Ergebnisse Anwendern als Microsoft Excel Dateien zur Verfügung zu stellen. Dabei sollte berücksichtigt werden, dass dies nur ein ganz kleiner Ausschnitt der Möglichkeiten ist, die R mit seinen mittlerweile über 3700 Erweiterungspaketen bietet.

 

Webbasierte Business Anwendungen mit R zur Visualisierung von Social Media Analysen

Analysen und Reporting, in einer ansprechenden visuellen Form dargestellt, ermöglichen breiten Nutzergruppen den Zugang zu großen und komplexen Daten. Dashboards – in Echtzeit aufbereitete und webbasiert zur Verfügung gestellte Ergebnisse ermöglichen schnelle Reaktionszeiten.

R in Verbindung mit modernen Web-Technologien bietet vielfältige und umfassende Möglichkeiten für Business Analytics Anwendungen.

Ein Einsatzfeld zur Visualisierung der Ergebnisse von Analysen auf großen Datenbeständen sind soziale Netzwerke. Kunden, Interessenten, Multiplikatoren oder auch Wettbewerber senden Nachrichten über Twitter, Facebook und andere Plattformen an ihre Freunde und Follower. So ist es durchaus interessant, die Häufigkeit, die Inhalte oder die Tonalität solcher Nachrichten – beispielsweise über das eigene Unternehmen, eine Marke oder ein Fachthema – zu analysieren. Ein prädestiniertes Beispiel einer solchen Analyse sind Twitter-Nachrichten oder „Twitter-Gespräche“. Hier ermöglichen analytische Arbereitung und die passenden Algorithmen einen Blick auf die Zusammenhänge von Themen, Begriffen, Hashtags oder Autoren. Diese gewonnenen Informationen können je nach Fragestellung entsprechend aufbereitet und dargestellt werden.

Twitter Monitor als Web Applikation mit R

Twitter Monitor als Web Applikation mit R

Was sagt zum Beispiel die Community jetzt gerade jetzt über BigData? Welche Themen sind gerade angesagt? Wer kommunizert?

eoda hat eine Applikation entwickelt, die als ein praktisches Beispiel eine solchen Datenaufwertung verdeutlicht. Der „BigData Twitter-Monitor“ visualisiert die  Anzahl von Twitter-Feeds zu dem Hashtag „BigData“ im Verhältnis zu den Begriffen „openaccess“ und „opendata“. Zusätzlich werden die in diesem Kontext (via Hashtag) gekennzeichneten Begriffe nach ihrer Häufigkeit dargestellt.

Über R

R ist eine Open-Source Programmiersprache zur statistischen Datenanalyse und
–visualisierung. In vielen Bereichen ist R den kommerziellen Softwarelösungen
überlegen. Dazu zählen vor allem die Möglichkeiten zur Visualisierung. Gerade
in Verbindung mit der einfachen Möglichkeit zur Anbindung diverser Datenquellen
aus verteilten Datenbanken, Internet etc. eröffnen sich so innovative Möglichkeiten des Informationsgewinns und der Darstellung von Ergebnissen. Führende Anbieter integrieren R in ihre Lösungen oder bieten Schnittstellen zu R.

eoda nutzt R auch als Business Analytics Schicht um Collaborative BI Lösungen zu entwickeln. Die intelligente Verbindung aus den umfangreichen Möglichkeiten zur Datenvisualisierung und den statischen Methoden von R mit modernen Web Technologien schafft sehr flexiblen Lösungen für Business Analytics zu niedrigen Gesamtkosten.

Die Schwarmintelligenz im Unternehmenseinsatz – Chancen und Risiken

In verschiedenen Unternehmensbereichen wird zunehmen mit den Phänomen der Schwarmintelligenz experimentiert. Herausstechend sind dabei Versuche, die Genauigkeit der Absatzprognosen in Vertrieb oder Logistik zu verbessern. Die Einsatzmöglichkeiten sind  jedoch vielfältig und so interessieren sich unter anderem auch Personal- oder Innovationsmanager für das Thema. Es erscheint dabei verlockend, moderne Kommunikationstechniken wie Social Media  einzusetzen. Der folgende Beitrag beleuchtet kurz zusammengefasst einige Aspekte zum erfolgreichen Einsatz der Schwarmintelligenz.

War das Feld der Schwärme vormals lediglich den Biologen und ihren Untersuchungen über Ameinsenvölker und Zugvögel überlassen, entwickelt sich die von James Surowiecki benannte „Weisheit der Vielen“ zum geflügelten Wort von Soziologen, Marketing oder Vertriebsverantwortlichen. Ob nun Schwarmintelligenz, die Weisheit der Vielen oder kollektive Intelligenz – bezeichnet wird damit die Fähigkeit einer Gruppe, durch ihr synergetisches Zusammenwirken zu besseren Ergebnissen zu kommen, als es durch Einzelpersonen zu erwarten wäre.

Schon 1906 verblüffte Francis Galton, als er auf einem Viehmarkt die Tipps von 800 Besuchern zum Gewicht eines Ochsen addierte und nach Teilung der Summe durch die Zahl der Besucher auf das exakte Gewicht kam. Die Phänomene die sich der kollektiven Intelligenz unterordnen, sind dabei ebenso zahl- wie facettenreich. Ein Beispiel ist die sogenannte Wahlwette, die zu Wahlvorhersagen aufruft und über eine Mittelwertmethode ausgewertet wird. Gleichermaßen zu Prognosezwecken eingesetzt, gelten die Ergebnisse von Informationsmärkten als Ausdruck kollektiver Intelligenz. Ebenso Web 2.0 Anwendungen wie Wikipedia oder klassische Text-Mining-Analysen von Suchanfragen, bspw. bei google. Auch die Annäherung von Organisationsstrukturen an flache Hierarchien und eigenverantwortliche Teams führen letztlich zum Abschöpfen kollektiver Potenziale.

Erfolgsfaktoren und Herausforderungen für den Einsatz der Schwarmintelligenz

Surowiecki bringt die Bedingungen unter denen sich kollektive Intelligenz entwickeln kann auf eine recht simple Formel. Die Gruppenkonstellation ist dazu an drei Voraussetzungen gebunden:

  • Diversität – Die Gruppe kennzeichnet ein hohes Maß an Heterogenität.
  • Dezentralität – Die Personen werden nicht durch ein höheres Organ koordiniert.
  • Unabhängigkeit – Jedes Individuum ist möglichst frei von der Beeinflussung durch andere.

Zusätzlich benötigt es noch eines Instruments, das die unstrukturierten Informationen der Einzelpersonen zu einem Mehrwert zusammen führt.

Was in der Theorie recht einfach klingt, birgt in der Praxis einige Herausforderungen. Erst einmal existieren vielerlei Ausprägungen kollektiver Intelligenz. Diese sind zahlreichen Einflüssen ausgesetzt, die sich deutlich voneinander unterscheiden.

Kollektive Intelligenz zur Prognose von zukünftigen Ereignissen

Wie sollten die Gruppen zusammengesetzt werden? Gruppen lassen sich bspw. darüber charakterisieren, ob die Personen überhaupt wissen, inwieweit sie Teil einer Gruppe sind. Es lassen sich Gruppen differenzieren, deren Mitglieder anonymisiert oder personalisiert und taktisch-verbunden bzw. taktisch-unverbunden sind. Weitere Fragen stellen sich nach der Art der genutzten Kommunikationswege, den statistischen Feedbacks und den Ergebnispräsentationen.

Durch eine von eoda in Kooperation mit der Universität Kassel durchgeführte und untersuchte Wahlwette in Kassel und nordhessischen Kommunen zeigte sich beispielsweise, dass das Kriterium der Diversität keinerlei Einfluss auf die Prognosequalität hatte. Vielmehr ist bei einer Wahlwette die Bedingung einer möglichst gut informierten Gruppe zu stellen.

Kollektive Intelligenz im Unternehmens-Wiki

Ein anderes Beispiel für Herausforderungen beim Transfer von kollektiver Intelligenz in gezielte Anwendungen ist die Übertragung des globalen Wikipedia-Prinzips auf Unternehmensebene, beispielsweise ein Unternehmenswiki. Hier reicht es nicht, lediglich durch das Bereitstellen einer Plattform auf einen plötzlich einsetzenden Informationsfluss zu hoffen. In jedem Unternehmenskontext ist die spezifische Sozialstruktur zu berücksichtigen, die schlussendlich zweierlei betrifft: Die Motivation der Mitarbeiter zur aktiven Teilhabe an dem Projekt und ihre Entscheidungsunabhängigkeit innerhalb dessen.

Fazit – Social Media und kollektive Intelligenz bieten große Chancen

Kollektive Intelligenz unterstützt durch den gezielten Einsatz moderner Kommunikationstechniken kann sehr erfolgreich sein. Mit geringem Mitteleinsatz lassen sich hier große Wirkungen erzielen. Allerdings müssen dafür gezielte Vorüberlegungen und Analysen durchgeführt werden. Der produktive Einsatz der Schwarmintelligenz muss gewissermaßen konstruktiv unterstützt werden.

Die Anatomie eines „Twitter-Gesprächs“ – Social Media mir R analysieren

Was hat Big Data mit Christian Wulff zu tun? Und welche Rolle spielt dabei Hans Sarpei, der Außenverteidiger von Schalke 04? Über Social Media lassen sich Zusammenhänge zwischen Themen erschließen. Vernetzte Kommunikation ist ein Schlagwort des 21. Jahrhunderts. Neue Kommunikationsmittel verändern die Verständigung: Menschen werden immer erreichbarer, Kommunikation dafür kürzer, indirekter, oberflächlicher – wirklich?

Tony Hirst hat einen interessanten Ansatz aufgezeigt, eine Art der modernen Kommunikation zu analysieren: Das „Twitter-Gespräch“. Grundlage des Diskurs sind Inhalte wie bestimmte Wörter oder Tags. Hier ein Beispiel einer Analyse Hashtags, die in Tweets zum Tag „BigData“ verwendet werden.

Hashtags zu BigData in 1000 aufeinanderfolgenden Tweets

Hashtags zu BigData in 1000 aufeinanderfolgenden Tweets

 

Für die Tweets, die BigData und Cloud behandeln, wird im Folgenden dargestellt, wie der Diskurs verläuft. An der vertikalen Achse befinden sich von unten nach oben in chronologischer Reihenfolge die Twitter-User, die sich neu an dem Diskurs beteiligt haben. Jeder Punkt steht dabei für einen Tweet; in blau normale Tweets, in rot klassische Re-Tweets.

Anatomie eines Diskurs zu BigData und Cloud via Twitter

Anatomie eines Diskurs zu BigData und Cloud via Twitter

 

Erkennbar ist, dass das Gespräch in Wellen verlaufen ist und sich immer wieder neue Personen beteiligt haben. Ein großer Anteil der Kommunikation besteht aus Re-Tweets.

Einen anderen Verlauf einer Diskussion zeigt die vergleichbare Auswertung über die letzten 1.000 Tweets zur Causa Wulff. Hier wird deutlich stetiger kommuniziert und eine Vielzahl neuer Nutzer beteiligt sich an dem Thema.

Anatomie eines Diskurs zu Christian Wulff über Twitter

Anatomie eines Diskurs zu Christian Wulff über Twitter

 

Zur Nachtzeit in Deutschland wird weniger aktiv über Herrn Wulff getwittert. In diesem Diskurs ist auch der Anteil der Re-Tweets deutlich geringer. Die Inhalte des Diskurses spiegelt die folgende Wordcloud wieder:

Wordcloud zu Wulff auf Twitter

Wordcloud zu Wulff auf Twitter

 

Und Hans Sarpei? Schaut man sich an, wer die direkten Adressaten der Tweets um das Thema Wulff sind, steht sein Name ganz oben auf der Liste.

Verlinkte Namen zu Wulff-Tweets

Verlinkte Namen zu Wulff-Tweets

 

Warum das so ist und ob das eine Bedeutung hat? Das sind die Geheimnisse hinter den Datenmengen von Social Media …

Pressemitteilung: Revolution Analytics und eoda geben Partnerschaft bekannt

 

eoda bietet analytische Software-Lösungen basierend auf „Revolution R Enterprise“

20.02.2012, Kassel, Deutschland. Der auf Lösungen für „High Performance Analytics“ spezialisierte Anbieter Revolution Analytics und der deutsche Datenanalyse-Spezialist eoda geben ihre Partnerschaft bekannt. Der IT-Dienstleister eoda, Kooperationspartner der Universität Kassel und Vorreiter in Deutschland für die Statistik-Sprache R im Business-Umfeld, bietet Consulting, Training und Integrationsleistungen zu R. Die Wissenschaftler und IT-Experten von eoda sind spezialisiert auf die Analyse von strukturierten und unstrukturierten Daten. Als Vertriebs- und Beratungspartner entwickelt eoda Lösungen zur Datenanalyse auf der Basis von Revolution R Enterprise und leistet deutschsprachigen Support für die Produkte von Revolution Analytics.

„Die Partnerschaft mit eoda ist ein weiterer Schritt im Rahmen unserer internationalen Expansion“ sagt David Smith, Vice President Marketing und Community von Revolution Analytics. „Wir teilen die gleiche Vision von High Perfomance Analytics, der Verbindung aus High Performance Computing und hochwertiger Datenanalyse. Wir teilen die gleiche Leidenschaft für R und das einzigartige Potenzial dieser Sprache, Innovationen in der Datenanalyse für Unternehmen verfügbar zu machen. Wir unterstützen beide die dynamische Community der R-Entwickler und Nutzer, die eine breite Palette an Anwendungen und Verfahren zur wissenschaftlichen Datenanalyse entwickelt.“

Für Datenanalyse begeisterte Anwender profitieren durch die Partnerschaft von der lokalen Präsenz der Spezialisten von eoda, die in ein weltweites Netz aus Analyse-Experten eingebunden sind.

Revolution Analytics und eoda geben Big Data einen Sinn

Kürzere Produktlebenszyklen, Individualisierung sowie die fortschreitende Digitalisierung erhöhen die Menge der vorhandenen Daten und gleichzeitig die Notwendigkeit, intelligent mit dem Rohstoff Daten umzugehen. Social Media und die Vernetzung der Gegenstände untereinander, wie in der Logistik, treiben die Entwicklung voran. Für Unternehmen ist Big Data das Synonym für die beispiellosen Möglichkeiten, nützliche Erkenntnisse aus großen Datenmengen zu gewinnen. Die Chancen und die Herausforderungen, die Big Data darstellt, sind das Spezialgebiet von eoda.

„Eine logistische Regression, über eine Million Zeilen, die in Prognosen oder Ratings zum Einsatz kommen kann, hat eine inhaltliche – also handwerkliche – und eine technologische Dimension“, stellt Heiko Miertzsch, Geschäftsführer von eoda, die Herausforderung für Anwenderunternehmen dar. Die Partnerschaft führt ein leistungsfähiges modernes Framework zur Datenanalyse basierend auf R mit den analytischen Erfahrung von eoda zusammen. Miertzsch: „Unsere Analyse-Spezialisten helfen Anwendern, die richtigen Fragen zu erarbeiten und die Ergebnisse der Analysen zu interpretieren. Revolution R Enterprise von Revolution Analytics ist dabei ein mächtiges Werkszeug, das Ergebnisse in Sekunden statt Tagen liefert – ohne teure Hardware. Zusammen bieten wir vergleichsweise günstige TCO und so auch die Möglichkeit, mit verschiedenen Modellen zu experimentieren, bevor man den optimalen Ansatz wählen kann.“

Über:

R – „die mächtigste Programmiersprache zur Datenanalyse

R ist eine Software zur Datenanalyse und Visualisierung. 1993 an der Universität von Auckland in Neuseeland entwickelt, steht R für einen völlig neuartigen Ansatz, mit Daten aller Art umzugehen. R bietet eine Vielzahl von statistischen Methoden (lineare und nichtlineare Modellierung, klassische statistische Testverfahren, Zeitreihenanalyse, Clusteranalysen etc.) und Werkzeuge zur grafischen Visualisierung. Dabei ist R in höchstem Maße erweiterbar. Eine der Stärken von R ist die Einfachheit, mit der sich perfekt gestaltete publikationsreife Grafiken erstellen lassen. Und während die Standardeinstellungen schon sehr gute Ergebnisse liefern, bleibt dem Benutzer die volle Kontrolle über alle Elemente, um eine Grafik an die eigenen Anforderungen anzupassen. R wird weltweit von schätzungsweise 2 Millionen Nutzern in Unternehmen und Wissenschaft genutzt. Die Community hat mehr als 2.500 Pakete entwickelt, die Bausteine zur Erstellung analytischer Modelle darstellen.

Revolution Analytics

Revolution Analytics ist der führende Anbieter für kommerzielle Software und Services basierend auf dem Open Source Projekt R. Das Unternehmen verbindet hohe Leistungsfähigkeit, Produktivität und Verfügbarkeit mit R. Das Kernprodukt Revolution R Enterprise erfüllt die Anforderungen der großen Unternehmen aus den Bereichen Finanzdienstleistungen, Biowissenschaften, Handel, Industrie und Medien an eine Software zur Datenanalyse. Eingesetzt von Branchenführern wie Google, Lloyds und der New York Times hat sich R zu einem Standard für innovative statistische Datenanalyse durchgesetzt. Revolution Analytics unterstützt das anhaltende Wachstum der R Community durch das Sponsoring weltweiter Nutzergruppen und dem Portal Inside-R.org, sowie der freien Version von Revolution R Enterprise für Studenten und Mitarbeiter an Universitäten.

eoda

eoda ist ein IT-Dienstleister, der auf die Analyse von strukturierten und unstrukturierten Daten und die Visualisierung von Ergebnissen spezialisiert ist. Das Portfolio umfasst Beratung, Software-Entwicklung, Integration und Training. eoda ist ein interdisziplinäres Team aus Ingenieuren, Wirtschafts- und Sozialwissenschaftlern sowie Statistik- und IT-Experten. Die Leistungen erstrecken sich über den gesamten Workflow von der Datenerfassung/-erhebung über die Analyse bis zur Interpretation der Ergebnisse. Wir kombinieren fundiertes Wissen über Geschäftsprozesse mit der kompetenten Anwendung der richtigen Analyseverfahren. So schaffen wir strategischen Mehrwert für Unternehmen. Wir helfen Entscheidern, in der Datenflut den richtigen Kurs zu setzen, um Wissen und Chancen zu erschließen. Mit der R-Akademie bietet eoda ein integriertes ganzheitliches Schulungs- und Weiterbildungskonzept für die Welt der Datenanalyse mit R an. Ausgerichtet auf die Bedürfnisse von Anwendern in Unternehmen werden schnell und umfassend praxisrelevante Inhalte vermittelt.

Geodatenanalyse und -visualisierung mit R

Ein faszinierendes Beispiel für die Möglichkeiten der Datenvisualisierung mit R hat der Brite James Cheshire geliefert. Er nutzte die Daten des Fahrradverleihs „Barclays Cycle Hire“ um eine grafische Darstellung der beliebtesten Fahrradrouten Londons zu erstellen. Cheshire nutzte dafür die Programmiersprache R und das R-Paket ggplot2:

Wer das ganz nett findet, aber nach praktischen Anwendungsmöglichkeiten dieser Arbeit fragt, dem liefert Cheshire die Antwort gleich mit: In einem zweiten Schritt kombinierte er seine Arbeit zur Nutzung von Fahrradwegen mit öffentlichen Daten zur Schadstoffbelastung in London. Anhand der neuen Karte kann nun untersucht werden, in welchen Regionen Fahrradfahrer bereits besonders belastete Routen vermeiden können und wo noch nachgebessert werden sollte, um die Stadt fahrradfreundlicher zu gestalten:

R auf dem World Economic Forum

Der Environmental Performance Index (EPI) ist ein Versuch, die ökologische Leistungsbilanz von Staaten und Unternehmen quantitativ darzustellen und zu vergleichen. Entwickelt wurde der Index vom Fachbereich Environmental Sustainability der Yale University. Beim diesjährigen World Economic Forum hat Professor John Emerson die aktuellen Ergebnisse vorgestellt.
Auf der Website der Yale University sind die in R analysierten Ergebnisse dargestellt.