Alberto Cairo rückt meine Perspektive zurecht

Doing Journalism with Data, Teil 5: Visualisierung

Im fünften und letzten Modul des Kurses Doing Journalism with Data geht es um den Bereich des Datenjournalismus, der mir am meisten Spaß macht: Visualisierung. Karten, Diagramme, interaktive Grafiken: Wie man ein Thema visuell verständlich und mit Erkenntnisgewinn auf den Punkt bringt, das ist das Leib- und Magen-Thema von Alberto Cairo (Twitter, Blog). Im Online-Kurs stellt er weniger die Tools als vielmehr die Grundprinzipien der Infografik in den Mittelpunkt, wie er sie auch seinen Studenten an der Universität von Miami nahebringt.

Charles Joseph Minards Darstellung des Russland-Feldzugs der Franzosen 1812-1813, veröffentlicht 1869.  Quelle: Wikimedia Commons

Charles Joseph Minards Darstellung des Russland-Feldzugs der Franzosen 1812-1813, veröffentlicht 1869. Quelle: Wikimedia Commons

Mehr

Nicolas Kayser-Bril drückt mir einen Besen in die Hand

Doing Journalism with Data - Teil 4: Messy data - Daten säubern mit OpenRefine

Unterschiedliche Schreibweisen, Abkürzungen oder Zahlenformate, Doubletten, Rechtschreibfehler, überflüssige Leerzeichen, fröhliches Hin und Her zwischen Singular und Plural: “Messy data” ist das täglich Brot des Datenjournalismus. Besonders beim Zusammenführen von Datensätzen aus mehreren Quellen ist das Ergebnis mitunter ein ziemliches Durcheinander. Das weiß der französische Journalist und Programmierer Nicolas Kayser-Bril (Web, Twitter) aus eigener Anschauung, er ist Mitgründer und CEO der Daten-Agentur Journalism++. Im vierten Modul des Online-Kurses “Doing Journalism with Data” schickt er professionelle Reinigungskräfte aufs Feld. Das stärkste Mittel gegen Datenmüll: OpenRefine (ehemals Google Refine).

OpenRefine hilft, Datenchaos zu bereinigen

OpenRefine hilft, Datenchaos zu bereinigen

Mehr

Steve Doig geht mit mir auf Schatzsuche

Doing Journalism with Data - Teil 3: Newsroom-Mathematik mit Excel & Co

Angst vor Mathe? Steve Doig (Twitter) ist genau der Richtige, um sie zu zerstreuen. Wenn der Journalismus-Professor von der Arizona State University und Pulitzer-Preisträger in seiner väterlich-ruhigen Art den Unterschied zwischen Durchschnitt und Median erklärt, verstehe sogar ich das.

Wenn Journalisten sich vor Mathematik fürchten, ist das nicht ganz unbegründet. Nur ein Fehler, eine einzige falsche Berechnung kann erheblich an der Glaubwürdigkeit kratzen. Die gute Nachricht: Es braucht eigentlich nur die Grundrechenarten, um über die Runden zu kommen. Das müsste doch selbst für uns Journalisten zu bewältigen sein …

Mehr

Paul Bradshaw zeigt mir, wie man kratzt

Doing Journalism with Data - Teil 2: Datenquellen und Scraping

Daten finden ist das Thema des zweiten Moduls im Online-Kurs “Doing Journalism with Data”, über den ich hier in einer kleinen Serie berichte. Experte ist Paul Bradshaw (Twitter), der an der Birmingham City University Online-Journalismus lehrt und das Online Journalism Blog betreibt. Er zeigt mir, wie man Daten automatisiert auslesen kann, nennt mir eine Alternative für den Fall, dass eine Website keinen RSS-Feed oder eigenen Mail-Alert anbietet, und erinnert mich an Möglichkeiten, die ich im Arbeitsalltag oft vergesse.

Mehr

Simon Rogers hat Trost für mich

Doing Journalism with Data - Teil 1: Datenjournalismus-Grundlagen

“Don’t focus on tools, focus on storys”: Paul Bradshaw, britischer Online-Journalist und Blogger, hat mit dieser freundlichen Mahnung mich gemeint. Ganz bestimmt. Denn ich neige dazu, in meiner Begeisterung für neue Werkzeuge schnell mal die eigentliche Geschichte aus den Augen zu verlieren. Die aber steht auch im Datenjournalismus im Vordergrund und am Anfang eines Projekts. Nett von Paul Bradshaw, mich am Ohr zu ziehen und daran zu erinnern.

 Die Krankenschwester Florence Nightingale stellt im 19. Jahrhundert die Todesursachen während des Krimkrieges  als Diagramm dar. Nightingale-mortality  von w:Florence Nightingale (1820–1910). - http://www.royal.gov.uk/output/Page3943.asp. Lizenziert unter Public domain über Wikimedia Commons.


Die Krankenschwester Florence Nightingale zeigt im 19. Jahrhundert, dass im Krimkrieg die meisten Soldaten an Infektionskrankheiten sterben und nicht an Kriegsverletzungen.
Bild: http://www.royal.gov.uk, lizenziert unter Public domain über Wikimedia Commons.

Er ist einer von fünf renommierten Datenjournalisten, bei denen ich in den vergangen Wochen den Online-Intensivkurs “Doing Journalism with Data: First Steps, Skills and Tools”  des European Journalism Centre absolvieren durfte, zusammen mit vielen tausend anderen Teilnehmerinnen und Teilnehmern aus der ganzen Welt. Es war ein MOOC, ein Massive Open Online Course, kostenlos und offen für alle, mit insgesamt 20 Video-Vorträgen in fünf Modulen, jeweils ergänzt durch Zwischentests und sehr rege geführte Forumsdiskussionen, aus denen ebenso viel zu lernen war wie aus den Vorträgen selbst. Der erfolgreiche Abschlusstest wird mit einem Zertifikat belohnt, und ich bin glücklich, meinen letzte Woche bestanden zu haben.

Was ich gelernt habe, will ich hier in einer fünfteiligen Serie aufschreiben. In diesem ersten Teil geht es um die Grundlagen.

Mehr

Hamburger leben länger!

Vorbildlich: Das Max-Planck-Institut für Demografieforschung hat nicht nur herausgefunden, dass die Lebenserwartungen in Deutschland sehr unterschiedlich verteilt ist, sondern stellt auch gleich Rohdaten der Studie inklusive Geodaten zum Download zur Verfügung. So konnte ich recht schnell diese Karte erstellen:

Sie zeigt, wie stark der Anteil von Uralten (das sind jene, die gegen Ende des 19.Jahrhunderts in der jeweiligen Region geboren wurden, im Untersuchungszeitraum von 1989 bis 2002 also 105 Lebensjahre oder mehr auf dem Buckel hatten) nach oben oder unten vom Bundesdurchschnitt abweicht. Und siehe da: An der Küste lebt sich’s länger! Ganz besonders lange leben die Hamburger, die Stadt ist Spitzenreiter mit einem Hochbetagten-Anteil, der um 71 Prozent über dem Durchschnitt liegt.

Mehr

Bornheim ist wieder Bornheim

... und die Geodaten zu Frankfurter Stadtteilen sind aktualisiert

Höhenstraße: Hier beginnt nun wieder Bornheim

Höhenstraße: Hier beginnt nun wieder Bornheim

Der Frankfurter Stadtteil Bornheim ist nun auch offiziell wieder dort Bornheim, wo ja eigentlich immer Bornheim war: Ab der Höhenstraße die Bergerstraße aufwärts. Ende letzten Jahres hat die Stadt die Stadtteilgrenze offiziell in Richtung Südwesten verschoben – dorthin, wo sie nach dem Gefühl der Bornheimer schon immer gehört, an die Höhenstraße. Zuvor gehörte auch der mittlere Teil der Bergerstraße, zwischen Höhenstraße und Bornheim-Mitte gelegen, offiziell zu Nordend-Ost. Wie es einst zu dieser irritierenden Grenzziehung gekommen war, erklärt Stadtkind Ffm hier. Nun also beginnt Bornheim an der Höhenstraße, und Arnsburger-, Petterweil- und mittlere Bergerstraße, der Germaniaplatz und die St.Josefskirche, sie alle sind endlich zu Hause. :)

Anlass für mich, die Geodaten der Frankfurter Stadtteilgrenzen zu aktualisieren. Bei dieser Gelegenheit habe ich auch viele Ungenauigkeiten ausgebessert. Jetzt also ganz frisch und noch besser als vorher:

KML-Daten zum Download

  • KML-Daten: alle Stadtteile von Frankfurt am Main (Download)
  • KML-Daten: Frankfurter Stadtteile, zugeschnitten auf Darstellung von Wahlergebnissen (Download)

Google reicht nicht mehr

So viel Visualisierung war nie wie bei der Bundestagswahl 2013: Die Berliner Morgenpost erstellte eine vielgelobte Berlin-Wahlkarte, Zeit online machte aus der Landkarte Deutschlands eine Karte von Wahlland. Am besten gefällt mir der Wahlatlas von Michael Neutz:   Er ist intutiv zu bedienen, zeigt mir schnell, was ich wissen will (zum Beispiel die Wahlkreis-Hochburgen einer bestimmten Partei) und bietet mehrere Zugangswege zu den Daten, bis hin zu der Möglichkeit, die Darstellung der Häufigkeiten auf der Deutschlandkarte anhand von eigenen Werten zu verändern.

Im Blog von Open Data City sind noch viele weitere Beispiele gesammelt. Meine Wahlkarten für Frankfurt am Main sind nicht dabei. Das hat schon seine Richtigkeit, denn längst sind, wie die Linksammlung beweist, viel komplexere Visualisierungen möglich als jene, die ich mit Hilfe von Google in der Wahlnacht erstellt habe.

Aber was hätte ich machen sollen – ich war jung und hatte ja nichts außer Google! Immerhin: Mit Fusion Tables, dynamischen Templates (für die Info-Fenster) und dem Image Chart Editor (für die Balkendiagramme) konnte ich interaktive Wahlkreis- und Stadtteilkarten für Frankfurt machen, die es sonst nirgends gab, und mit allen wichtigen Informationen versehen, darunter der Wahlkreis-Gewinner, die Verteilung der Erststimmen auf die Direktkandidaten und das Zweitstimmen-Ergebnis als Chart. Letzteres generierte sich dynamisch aus den Parteiergebnissen in meiner Tabelle (hier steht, wie das geht).

Allerdings war vor allem die Sache mit den dynamischen Charts eine Zitterpartie, denn Google stellt den Dienst in Kürze ein. Auch deshalb stellt sich für mich immer drängender die Frage: Ist es wirklich noch klug, sich bei Visualisierungsprojekten auf die Werkzeuge von Google zu verlassen? Nachhaltige Projekte laufen immer Gefahr,  ihre Funktionalität zu verlieren, falls Google sich entschließt, den in Anspruch genommenen Dienst zu beerdigen (womit man ja immer rechnen muss). Und selbst, wenn das nicht der Fall ist, bleibt trotz guter Vorbereitung immer eine Unsicherheit: Wird das Tool funktionieren? Oder schlägt zum Beispiel gerade dann, wenn es darauf ankommt, der Upload einer Datentabelle fehl: “Try again later!”? Ein Alptraum, zumindest an Wahlabenden.

Mehr

Karten-Visualisierung: Drei Tools im Test

Wenn es in Statistiken um Ländervergleiche geht, bietet sich oft eine Heatmap oder Choroplethenkarte zur besseren Verständlichkeit an – eine Gebietsstufenkarte, auf der die verschiedenen Länder oder Regionen je nach Wert unterschiedlich intensiv eingefärbt sind. Regionale Unterschiede oder auch mögliche Zusammenhänge lassen sich damit auf einen Blick erfassen. Dieser Tage legte das Statistische Bundesamt zum Beispiel Zahlen aus 2010 zur Armutsgefährdung in den EU-(und einigen Nicht-EU-)Staaten vor – eine Gelegenheit, mal das eine oder andere Werkzeug für das Erstellen interaktiver Karten jenseits von Google Fusion Tables zu testen. Angeschaut habe ich mir OpenHeatMap, CartoDB und Tableau Public.

Mehr

Wie unsicher ist Frankfurt wirklich?

Frankfurt, Hauptstadt des Verbrechens? Ach, gäjnse mer fodd mit dene olle Glischees. Alle Jahre wieder, wenn das BKA die Kriminalstatistik vorlegt, tönen Medien landauf landab, dass Frankfurt am Main die gefährlichste Stadt Deutschlands sei. Das ist natürlich Unsinn – nicht nur, weil ich in dieser wunderbaren Stadt sehr gerne lebe, sondern vor allem, weil die Zahlen etwas anderes sagen. Lesen muss man sie halt. Aber wer will schon eine knackige Schlagzeile totrecherchieren?

Mehr

Bad Behavior has blocked 568 access attempts in the last 7 days.