Zeitreihen von Eurostat mit DataMarket und R im xkcd-Stil visualsieren

Eurostat ist eine sehr umfangreiche Datenquelle für Zeitreihen, mit riesigem Potenzial zur Datenanalyse. Der Zugang zu den Daten gestaltet sich allerdings manchmal aufwendig und die Darstellungen ist in der Regel eher sehr nüchtern gehalten. xkcd hingegen ist ein Webcomic des ehemaligen NASA Mitarbeiters Randall Munroe, der regelmäßig im Guardian oder der New York Times abgedruckt wird und sich wachsender Beliebtheit – vor allem – unter Wissenschaftlern erfreut. Mit Hilfe von R lassen sich die trockenen Zahlen relativ einfach als Grafiken im xkcd-Stil erstellen und so beliebige Daten visualisieren.

Mit Hilfe von DataMarket, lassen sich Zeitreihen aus Quellen wie Eurostat und anderen Quellen leicht erforschen. Sucht man zum Beispiel Kennzahlen zur Entwicklung der Wohnungsmieten in Spanien und Griechenland, wird man auf DataMarket schnell fündig und kann Daten aus umfangreichen Quellen analysieren. DataMarket bietet darüberhinaus die Möglichkeit, die Visualisierungen von Zeitreihen einfach in die eigene Webseiten zu integrieren, wie hier am Beispiel des Harmonisierten Verbraucherpreisindex für Wohnungsmieten gezeigt wird:

Mit Hilfe eines kleinen R-Scriptes lassen sich Daten von DataMarket direkt in R einlesen, weiter analysieren und mit Hilfe der umfangreichen Möglichkeiten zur Visualisierung von Daten auch im xkcd-Stil visualisieren:

Eurostat Daten mit Hife von DataMarket und R im xkcd-Stil visualisieren

Nachfolgend ein Code-Beispiel, um Daten von Datamarket einzulesen und mit ggplot2 zu visualisieren.


####################################################################
library(ggplot2)
library(extrafont)
library(rdatamarket)


### Fonts bereitstellen
# font download http://xkcdsucks.blogspot.de/2009/03/xkcdsucks-is-proud-to-present-humor.html

# auf Windows Ghostscript installieren http://www.ghostscript.com/download/gsdnld.html
# Pfad ggf. anpassen

Sys.setenv(R_GSCMD="C:/Program Files/gs/gs9.05/bin/gswin64c.exe")
# auf win vorher:
#font_import()
loadfonts(quiet=TRUE,device="win")

# Datamarket Daten einlesen
df <- dmlist(ds="http://datamarket.com/data/set/1z6p/hvpi-gewichte-der-indizes#!display=line&ds=1z6p!24iu=1b:24iv=d.e")
dinfo <- dminfo(ds="http://datamarket.com/data/set/1z6p/hvpi-gewichte-der-indizes#!display=line&ds=1z6p!24iu=1b:24iv=d.e")


# Theme definieren
theme_xkcd <- theme(
  panel.background = element_rect(fill="grey"), 
  panel.grid = element_line(colour="white"),
  axis.text.y = element_text(colour="grey"), 
  axis.text.x = element_text(colour="grey"),
  text = element_text(size=30, family="Humor Sans")
)

# Grafik erzeugen
p <- ggplot(df, aes(Year, Value, colour=Geopolitische.Meldeeinheit))
p <- p + layer(geom="line",  size=2)
p <- p + labs(title=paste(dinfo$title, "-", df$Klassifikation.der.Verwendungszwecke.des.Individualverbrauchs...1998..COICOP.))
p <- p + theme_xkcd
p


Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>