Schlagwort-Archiv: Visualisierung

tableR vereinfacht die Prozesse von Marktforschern und Analysten

tableR ist eine neue Software von eoda, die den gesamten Prozess von der Erstellung des Fragebogens bis zur fertigen Ergebnispräsentation ohne Medienbrüche unterstützt. Ohne Programmierkenntnisse können Anwender Fragebögen entwerfen, Rohdaten auswerten und Tabellen sowie Grafiken erstellen.

Heterogene Toollandschaft führt oft zu Fehlern und hohen Prozesskosten

Die Auswertung von Daten ist oftmals gekennzeichnet durch Medienbrüche und manuelle Arbeitsschritte. Meist wird verschiedenartige Software für einzelne Prozessvorgänge genutzt. Damit sind notwendigerweise manuelle Transformationsschritte verbunden, die zu hoher Fehleranfälligkeit, zeitlichen Verzögerungen und unnötigen Kosten führen. Ineffizienzen, Qualitätsprobleme, zu lange Projektlaufzeiten und unzufriedene Kunden sind regelmäßig die Konsequenz. Gefördert durch das LOEWE-Programm des Landes Hessen, bietet eoda Marktforschern und allen, die regelmäßig Daten auswerten, eine Software, die die Prozesseffizienz dauerhaft steigert.

tableR: Fragebögen, Auswertungen, Tabellen und Grafiken in einem Tool

Mit tableR können Benutzer Fragebögen erstellen und diese sowohl als Office-Dokument exportieren, als auch mit Hilfe eines strukturierten XMLs zu einem Onlinefragebogen weiterverarbeiten. Der Fragebogen dient dabei außerdem als strukturierte Repräsentation der zu importierenden Rohdaten. Auf dieser Basis lässt sich mit einem Klick ein fertiger Report anfertigen, der vielfältig individualisiert werden kann. Die erstellten Tabellen und Grafiken können nach Office (Word, Excel, PowerPoint) und HTML exportiert werden. tableR bietet einen reproduzierbaren Ablauf. Dabei entsteht das zur Auswertung notwendige Skript automatisch im Hintergrund. Neben der Anwendung in der klassischen Marktforschung hat tableR ein vielfältiges Einsatzpotential, so können beispielweise beliebige strukturierte Datensätze eingelesen und analysiert werden. Weitere Analysemöglichkeiten sind durch die Integration der freien Statistiksprache R nahezu grenzenlos.

Diese Diashow benötigt JavaScript.

Beta-Test ermöglicht exklusive Einblicke in die Entwicklung von tableR

eoda startet ab dem 15. September einen Beta-Test für tableR. Interessierte können sich unter www.eoda.de/de/tabler.html registrieren. Teilnehmer des Beta-Tests haben die Möglichkeit, ihre Wünsche und Anregungen in die finalen Entwicklungsschritte von tableR einfließen zu lassen und so die Weiterentwicklung zu beeinflussen.

eoda Results as a Service – Plattform für analytische Applikationen

Mit Results as a Service bietet die eoda GmbH einen Lösungsverbund aus analytischen Applikationen auf einer skalierbaren Plattform. Die Anwendungen lösen verschiedene analytische Problemstellungen aus Bereichen wie Reporting, Data Mining oder Predictive Analytics – auch für Big Data. Zum Beispiel lassen sich mit „associateR“ Assoziationsanalysen durchführen, wie sie in der Warenkorbanalyse angewendet werden. Der „optimizeR“, löst Optimierungsprobleme die typischerweise im Kampagnenmanagement vorkommen. Eine andere Anwendung, „fuzzychekC“, findet ähnliche Einträge in Listen wie in Adressdatenbanken mit dem Ziel die Datenqualität durch die Vermeidung von Duplikaten zu verbessern. Reporting und Social Media Analysen sind andere Anwendungsgebiete. Weitere Apps befinden sich in der Entwicklung. Die Plattform bringt eine Reihe von Funktionen mit, die den Betrieb und die Administration vereinfachen wie die LDAP Integration, ein Wiki, APIs oder Schnittstellen zu Datenquellen.

"Results as a Service" von eoda

“Results as a Service” von eoda

Maßgeschneiderte Anwendungen und geringer Administrationsaufwand

Results as a Service ist vor allem ein Angebot für Fachabteilungen, die schnell eine analytische Anwendung zum Laufen bekommen möchten. Die Plattform kann auf einem Cloud Dienst oder auf einer eigenen Infrastruktur betrieben werden. Das modulare Konzept erlaubt es, die Anwendungen schnell bedarfsgerecht anzupassen und zu verbinden, so dass ganzheitliche Lösungen entstehen.

Weiterlesen

Die Lesbarkeit von Texten berechnen – der Flesch Index als ein Baustein von Text Mining Anwendungen

Zeitungsartikel, E-Mails, Briefe – Texte begegnen uns täglich auf unterschiedlichen Wegen. Unabhängig von der Übermittlungsart, der Länge und der Thematik eint die Verfasser das Bestreben nach einer hohen Verständlichkeit. Produktinformationen im Marketing, wissenschaftliche Ausarbeitungen, journalistische Artikel – die konkreten Beispiele, in denen eine hohe Verständlichkeit von niedergeschriebenen Inhalten wichtig ist, sind vielfältig. Eine verständliche Ausdrucksweise ist der Grundstein für nachvollziehbare Texte.

Dennoch begegnen einem im Alltag immer wieder Texte, bei denen es schwer fällt, sich den darin enthaltenen Inhalt zu erschließen. Neben für den Verfasser nicht beeinflussbaren Faktoren wie Fachwissen und Interesse des Rezipienten ist häufig eine unzureichende Lesbarkeit der Grund dafür, dass Botschaften falsch oder teilweise gar nicht beim Empfänger ankommen. In vielen Fällen ist die Komplexität vieler Texte nicht angemessen für die angesprochene Zielgruppe. Um dies zu erkennen und zu verbessern bietet sich die Anwendung des Flesch-Indexes unter zur Hilfename von Text Mining an.

Der Flesch-Index als Kriterium für die Lesbarkeit

Neben der Leserlichkeit, der inhaltlichen Struktur und dem Aufbau eines Textes ist die Lesbarkeit eines der Kriterien für die Textverständlichkeit. Die Lesbarkeit beschreibt die sprachliche Gestaltung. Hierzu zählen beispielsweise der Wortschatz oder die Komplexität der verwendeten Wörter und Sätze.

Der US-amerikanische Autor Rudolf Flesch entwickelte den nach Ihm benannten Flesch-Index. Dieser umfasst ein Verfahren zur formalen Bestimmung der Lesbarkeit eines Textes. Dieses ermöglicht es, Texte zu überprüfen und eine präzise Aussage darüber zu erhalten wie hoch die Lesbarkeit ist. Verfasser haben so die Möglichkeit einer Selbstkontrolle und erhalten Ansatzpunkte für Optimierungen. Zudem lassen sich Texte anhand der Bewertung durch den Flesch-Index klassifizieren. Da die Wortlänge in der deutschen Sprache im Durchschnitt höher ist als im Englischen, wurde der Flesch-Index wurde von Toni Amstad an die deutsche Sprache angepasst.

Berechnungsformel des Flesch-Index

Berechnungsformel des Flesch-Index für die englische  Sprache

Bei dem Ergebnis des Flesch-Index unterscheidet man allgemein zwischen einem hohen und niedrigen Komplexitätsgrad, wobei dieser mit steigendendem Wert abnimmt. Ein Text mit einem hohen Flesch-Index wie 100 würde demnach aus Sätzen bestehen, die jeweils lediglich zwei einsilbige Wörter enthalten und entspräche so einem niedrigen Komplexitätsgrad. Texte mit einem Flesch-Index von 20 und geringer sind entsprechend komplexer aufgebaut und entsprechen beispielsweise einer wissenschaftlichen Veröffentlichung, die sich in der Regel durch vielsilbige Fachbegriffe und komplexe Satzstrukturen auszeichnet.

Weiterlesen

School’s out: Building Interactive R Apps with shiny, googleVis in our R Academy

In our R Academy course “Interactive Datavisualization with R” participants learned today how to build interactive graphics in R using the shiny and the googleVis package.

Interactive Web Application with R

Interactive Web Application with R

Rstudios shiny package is a great way to build an Application for interactive visualizations out of R.
For our example App we recreated Hans Rosslings (Gapminder) Visualization which puts a countries Life-Expectancy in relation with its Gross-Domestic-Product.

We used the data from datamarket.com via the rdatamarket Package. We combined data from Gapminder(Population), the World Bank (GDP) and from the United Nations (Life-Expectancy) with each other. Datamarket.com even offers an R-console snippet for importing the data directly into R (Under Export).

The following lines of code shows what you need to do. Have fun with  R in the web.

# TODO: Add comment
# 
# Author: msc
###############################################################################

library("rdatamarket")
library("shiny")


#getting Data from datamarket.com
#life_expectancy and gdp
dminit("ba22bf5bdf044aaf980cdbde3504248c")
life_expectancy <- dmlist("15r2!hrp")
gdp <- dmlist("15c9!hd1")

#population
dminit("ba22bf5bdf044aaf980cdbde3504248c")
population <- dmlist("1cfl!r3d")


#renaming the value variable
names(gdp)[3] <- "GDP"
names(life_expectancy)[3] <- "life_expectancy"
names(population)[3] <- "Population"

#merge to one dataframe
data <- merge(gdp,life_expectancy, by = c("Country","Year"))
data <- merge(data, population, by = c("Country","Year"))

#data is only until 2008 complete
data <- data[data$Year <= 2008,]

#reducing data for only a few countries
data$Country <- as.character(data$Country)

selection <- c("Afghanistan","Australia","Austria","Belgium","Bolivia",
		"Brazil","Cambodia","Azerbaijan", "Chile","China","Denmark","Estonia","Ethiopia","Finland","France",
		"Georgia","Germany","Ghana","Greece","India","Indonesia","Iraq","Italy",
		"Japan","Lithuania","Luxembourg","Mexico","New Zealand", "Niger", "Norway", "Poland", "Portugal",
		"Rwanda", "Somalia", "South Africa", "Spain", "Sweden", "Switzerland", "Turkey",
		"Uganda", "Ukraine", "United Kingdom", "United States", "Vietnam")

data <- subset(data, Country %in% selection)

#saving the data
save(data, file = "shiny_beispiel/data.RData")

#run shiny app localy
runApp("shiny_beispiel")



Weiterlesen

“Interactive Graphics with R” Course – Kassel, Germany, October 24

Interactive graphics are a flexible and efficient way to analyze data and to present analysis results. Interactive graphic applications offer queries, selections, highlighting or the modification of graphic parameters. In the environment of R, there are various concepts that make the creation of interactive graphics and applications possible directly out of R (IPlots, googlevis, shiny e.g.). The course gives an overview of the creation of interactive graphics with R and provides tools to implement interactive visualizations in R independently.

What we offer:
•    Courses in small groups with a maximum of 12 participants
•    Sufficient practice phases to put the learned material to practice
•    High praxis orientation is guaranteed through our experienced trainers and application-oriented exercises
•    High quality materials and standard data records
•    Screening of the learning results
•    The courses are designed to be held in German, but can optionally be held in English

Here you can watch a Shiny demo. More information can be found here.

German election: Election promises visualized with R

Data analysis is mostly focused on structured and standardized data, e. g. data from data bases, because these data can be used easily for analysis. Nevertheless even unstructured data offer chances to generate advantages. Concrete applications like content analysis or sentiment detection are discussed more and more frequently.

Of course, there are still limits to the possibilities of qualitative data analysis. The automated recognition of moods is limited when it comes to ambiguous statements. But the unlimited availability of digital texts and documents shows that analysis of unstructured data is justified and useful. Unstructured data does exist in a plenty of forms. Examples could be e-mail histories as well as scientific papers. The analyses of those unstructured texts are complex through extensive data volume, differing formats and different types of problems.

Weiterlesen

eoda offers courses for data visualization and graphics with R

Graphic modeling can be nerve-stretching and stressful. eoda’s R academy will help you to manage and facilitate your work concerning graphic modeling as there are multiple possibilities to visualize contents appealingly. R provides features to create several kinds of graphics like boxplots, histograms, or scatterplots. The following graphics shall demonstrate different possibilities of data visualization with R exemplarily:

In the following three different possibilities are shown to visualize medals won by German athletes in Olympics since 1948.

Medals won by Germany since 1948

Medals won by Germany since 1948

Distribution of Medals won by Germany since 1948 (Boxplot)

Distribution of Medals won by Germany since 1948 (Boxplot)

Distribution of Medals won by Germany since 1948

Distribution of Medals won by Germany since 1948

 

Weiterlesen

eoda erweitert Jaspersoft Business Intelligence Lösungen um Data Mining und Predictive Analytics mit R

Maßgeschneiderte Dashboards zur interaktiven Visualisierung von Analyseergebnissen steigern die Benutzerfreundlichkeit.

Der Datenanalysespezialist eoda schließt eine Partnerschaft mit Jaspersoft, dem Lösungsanbieter für die Intelligenz innerhalb von Anwendungen und Geschäftsprozessen. Als Integrationspartner entwickelt eoda auf Basis der hochwertigen Jaspersoft-Software maßgeschneiderte Lösungen für anspruchsvolle Business Intelligence Anwender. Als europaweit erster Jaspersoft-Partner erweitert eoda die Reporting- und Business Intelligence Funktionalitäten der Jaspersoft BI Suite mit Hilfe der Open Source Statistiksprache R um vielfältige Funktionen aus den Bereichen Data Mining und Predictive Analytics.

eoda vertraut mit Jaspersoft auf eine der flexibelsten BI-Suites der Welt

Jaspersoft bietet eine skalierbare und flexible BI-Plattform, die für Cloud, Mobile und Big-Data- Szenarien sowie vielfältige Einsatzzwecke konzipiert ist. Die Flexibilität der Open Source Lösungen ermöglicht die bestmögliche Integration in bestehende und zukünftige IT-Umgebungen. Neben der Qualität der Lösungen ist die Offenheit der Anknüpfungspunkt für eoda: Das Kasseler Unternehmen erweitert die Funktionen von Jaspersoft mit einer R-Schnittstelle um individuelle Lösungen für Data-Mining und Predictive Analytics. Als erstes deutsches Unternehmen in der R-Foundation steht eoda für die Nutzung von R in Business Umfeld. „Jaspersoft bietet exzellente Integrationsmöglichkeiten für R. Jaspersoft und R sind in ihrem Bereich führend in Preis und Leistung. Die sich ergänzenden Anwendungsbereiche und Funktionen stellen für Anwender kalkulierbare und nachhaltige Vorteile dar”, erläutert Heiko Miertzsch, CEO von eoda, die Idee hinter der Partnerschaft.

Weiterlesen

Neue Lösung für Marktforscher: Ein Klick vom Fragebogen zum Tabellenband

  • Der gesamte Prozess der Datenerhebung ohne Medienbrüche
  • Komfortable Erstellung benutzerdefinierter R-Tabellen mit vielen Konfigurationsmöglichkeiten
  • Integration der Statistik-Sprache R mit über 4.500 Erweiterungspaketen zur Datenanalyse
  • Vielfältige Exportfunktionen in alle gängigen Formate

Mit tableR hat eoda heute auf der „useR!“ Konferenz im spanischen Albacete, der weltweit größten Konferenz für die Statistiksprache R, eine neue Software zur komfortablen Erstellung komplexer Tabellenbände vorgestellt. tableR unterstützt zudem den gesamten Prozess in Befragungsprojekten von der Entwicklung des Fragebogens über die Datenauswertung bis zur Erstellung der Tabellen und Grafiken ohne Medienbrüche. Der übliche Mix aus verschiedener Software entfällt so.

Um neue Daten als fundierte Basis für Entscheidungen zu gewinnen, ist die Datenerhebung in vielen Unternehmen und öffentlichen Institutionen ein wichtiger Baustein. Onlinebefragungen haben als einfache und kostengünstige Erhebungsmethode die Popularität in den letzten Jahren noch gesteigert. „Anwender wünschen sich für Mitarbeiter- und Kundenbefragungen eine Lösung, die den Kernprozess aus Fragebogengestaltung, Datenerhebung, Auswertung und Ergebnisaufbereitung ganzheitlich behandelt und vereinfacht“ weiß Oliver Bracht, als CTO bei eoda für die Entwicklung von tableR verantwortlich, aus langjähriger Erfahrung.

Weiterlesen

Eine kurze Geschichte über R

Schlagworte wie Big Data oder Data Mining erfahren zur Zeit eine besondere Aufmerksamkeit. Sie sind Ausdruck des Trends, Daten als wertvollen Rohstoff zu begreifen. IT-Systeme in Unternehmen produzieren jeden Tag riesige Datenmengen. Praktisch alle Unternehmensteile wie Einkauf, Produktion, Administration und Verkauf werden nahezu vollständig in IT-Systemen abgebildet. Auch im privaten, im wissenschaftlichen, oder öffentlichen Umfeld steigt die Bedeutung großer Datenbestände. Welche Potenziale verbergen sich jedoch in der Analyse der Daten und wie lässt die Wertschöpfung effizient bewerkstelligen?

Über R

Die Statistiksoftware R ist nach Norman Nie, dem Gründer und langjährigen CEO von SPSS, die zur Zeit mächtigste Programmiersprache zur Analyse und Visualisierung von Daten – sie ist frei erhältlich und gewinnt gerade massiv Zuspruch. In den USA ist der Absatz mit Fachbüchern zu R in Q4 2012  um 127% gestiegen. Nahezu alle IT-Anbieter im Umfeld von Big Data wie IBM, Oracle oder SAP öffnen Ihre Systeme für R. Die „Linux-Geschichte“ wiederholt sich aktuell im Markt für Analysesoftware. Die Qualität und den Innovationsgrad, den die zumeist wissenschaftliche R-Community heute an den Tag legt, ist unvergleichlich in der jüngeren IT-Geschichte. Profitieren werden davon nicht nur Wissenschaft oder die großen Unternehmen. Selbst mit geringem Budget lässt sich mit R der Mehrwert schaffen, der in den Datenbergen steckt. Weiterlesen