Inzwischen professionalisiert sich der Datenjournalismus. Es gibt immer noch Kollegen, die es schaffen, mit Excel Auswertungen zu machen. Das geht. Aber es geht auch anders. Mit R zum Beispiel.
Ich selbst hatte immer schon ein Faible für Programmiersprachen. Das ganze ist zwar in der Oberstufe ein bisschen eingeschlafen, aber als ich vor meinem Praktikum in der SZ Entwicklungsredaktion die Sprache „R“ gelernt habe, kam mir das Denken zu Gute. Denn die meisten Programmiersprachen sind ähnlich aufgebaut. Oft unterscheiden sich nur die Syntax und die einzelnen Befehlsnamen. Im Grundsatz sind viele Sprachen sehr ähnlich.
Python oder R? Egal!
In der Data Science werden oft Python und R verwendet. Der grobe Unterschied: Python kommt aus der Informatikrichtung, R aus der Statistik (Unnützes Wissen dazu: die Vorgängersprache hieß „S“). Beide Sprachen haben extrem viele kostenlose Zusatzpakete, so dass sie inzwischen eine sehr ähnliche Grundfunktionalität haben. Zumindest für den Datenjournalismus. Insofern ist es erst mal zweitrangig, welche Sprache man lernt. Es hilft aber ungemein, überhaupt eine zu lernen.
Denn Programmcode ist super hilfreich, um nachzuvollziehen, was wir in der Datenauswertung gemacht haben. Rein wissenschaftlich betrachtet ist unsere Forschung damit auch sauberer, weil sie wiederholbar ist. Praktisch ist auch, dass wir Programmcode vorbereiten können und ihn – wenn neue Daten kommen – einfach nur durchlaufen lassen müssen.
R lernen
Der Einstieg in R ist ziemlich einfach. Die Sprache steht unter einen freien Lizenz und ist sehr verbreitet in Wissenschaft und Wirtschaft. Daher gibt es sehr viele Möglichkeiten, einzusteigen. Viele Kurse beschreiben auch, wie man R überhaupt installiert – und meistens dazu auch die Oberfläche RStudio, die macht das Leben nochmals einfacher (man kann Hilfen zu den Befehlen abrufen und Grafiken direkt anzeigen lassen). Insofern kann man die großen MOOC-Anbieter schon empfehlen:
„Data Analysis“ bei Udacity. Sehr spannend bei diesem Kurs: Er wurde mit Facebook entwickelt und geht sehr stark auf die Arbeit der dortigen Forscher ein. Man arbeitet also mit vielen echten Daten und lernt neben R auch gleich die Analysetechniken.
Zusätzlich gibt es kleinere Startups, die sich auf das Lernen von Code (und R) spezialisiert haben.
Die CodeSchool hat einen R-Kurs.
Sehr cool finde ich auch Datacamp. Das ist ein Startup, das sich auf Python und R spezialisiert hat. Dort kann man alles lernen, was man braucht. Mit 300 Dollar im Jahr ist es nicht ganz günstig. Der R-Einstiegskurs ist aber gratis.
Mit Swirl direkt in R lernen
Eine weitere Lernmöglichkeit, die ich auch sehr ansprechend finde, ist Swirl. Es läuft als R-Library direkt im Hauptprogramm und bietet viele verschiedene kostenlose Kurse. Der Vorteil: Man tippt nicht im Browser, sondern direkt in R, wie man es dann später auch bei wirklichen Projekten macht.
Hat man das Grundkonzept mal verstanden, so kann man mit R genauso umfangreich arbeiten, wie mit Python. Ich persönlich benutze Python zum Scrapen und R zum Auswerten – oder um statische Grafiken zu erstellen. Prinzipiell könnte ich sogar interaktive Projekte mit R umsetzen. Und auch Webseiten oder APIs lassen sich damit super auslesen und abfragen. Das ist alles eine Frage der persönlichen Präferenz.
R weiterlernen
Wenn man die Grundzüge von R verstanden hat, kann man sich auf verschiedenen Wegen auf dem Laufenden halten und weiterbilden:
Timo Grossenbacher vom Datenjournalismusteam des SRF hat eine Webseite angelegt, die für verschiedene Arbeitsschritte im Datenjournalismus Tutorials für R enthält. .Rddj ist ein Klicktipp!
Ich persönlich lese gerne R Weekly. Das ist eine Linksammlung für Projekte und Tutorials mit R.
Ganz hilfreich kann auch R Bloggers sein. Die sammeln Blogposts rund um R aus verschiedensten Quellen.
Es gibt wirklich hunderte von Webseiten, die sich mit R beschäftigen, schreibt auch RStudio auf seiner Webseite. Über meine liebsten Libraries blogge ich ein anders Mal. Jetzt aber viel Spaß beim R lernen.
Weitere Tipps zu guten R-Lernangeboten nehme ich gerne hier auf. Schreibt mir doch bitte!