Alberto Cairo rückt meine Perspektive zurecht

Doing Journalism with Data, Teil 5: Visualisierung

Im fünften und letzten Modul des Kurses Doing Journalism with Data geht es um den Bereich des Datenjournalismus, der mir am meisten Spaß macht: Visualisierung. Karten, Diagramme, interaktive Grafiken: Wie man ein Thema visuell verständlich und mit Erkenntnisgewinn auf den Punkt bringt, das ist das Leib- und Magen-Thema von Alberto Cairo (Twitter, Blog). Im Online-Kurs stellt er weniger die Tools als vielmehr die Grundprinzipien der Infografik in den Mittelpunkt, wie er sie auch seinen Studenten an der Universität von Miami nahebringt.

Charles Joseph Minards Darstellung des Russland-Feldzugs der Franzosen 1812-1813, veröffentlicht 1869.  Quelle: Wikimedia Commons

Charles Joseph Minards Darstellung des Russland-Feldzugs der Franzosen 1812-1813, veröffentlicht 1869. Quelle: Wikimedia Commons

Mehr

Nicolas Kayser-Bril drückt mir einen Besen in die Hand

Doing Journalism with Data - Teil 4: Messy data - Daten säubern mit OpenRefine

Unterschiedliche Schreibweisen, Abkürzungen oder Zahlenformate, Doubletten, Rechtschreibfehler, überflüssige Leerzeichen, fröhliches Hin und Her zwischen Singular und Plural: “Messy data” ist das täglich Brot des Datenjournalismus. Besonders beim Zusammenführen von Datensätzen aus mehreren Quellen ist das Ergebnis mitunter ein ziemliches Durcheinander. Das weiß der französische Journalist und Programmierer Nicolas Kayser-Bril (Web, Twitter) aus eigener Anschauung, er ist Mitgründer und CEO der Daten-Agentur Journalism++. Im vierten Modul des Online-Kurses “Doing Journalism with Data” schickt er professionelle Reinigungskräfte aufs Feld. Das stärkste Mittel gegen Datenmüll: OpenRefine (ehemals Google Refine).

OpenRefine hilft, Datenchaos zu bereinigen

OpenRefine hilft, Datenchaos zu bereinigen

Mehr

Steve Doig geht mit mir auf Schatzsuche

Doing Journalism with Data - Teil 3: Newsroom-Mathematik mit Excel & Co

Angst vor Mathe? Steve Doig (Twitter) ist genau der Richtige, um sie zu zerstreuen. Wenn der Journalismus-Professor von der Arizona State University und Pulitzer-Preisträger in seiner väterlich-ruhigen Art den Unterschied zwischen Durchschnitt und Median erklärt, verstehe sogar ich das.

Wenn Journalisten sich vor Mathematik fürchten, ist das nicht ganz unbegründet. Nur ein Fehler, eine einzige falsche Berechnung kann erheblich an der Glaubwürdigkeit kratzen. Die gute Nachricht: Es braucht eigentlich nur die Grundrechenarten, um über die Runden zu kommen. Das müsste doch selbst für uns Journalisten zu bewältigen sein …

Mehr

Paul Bradshaw zeigt mir, wie man kratzt

Doing Journalism with Data - Teil 2: Datenquellen und Scraping

Daten finden ist das Thema des zweiten Moduls im Online-Kurs “Doing Journalism with Data”, über den ich hier in einer kleinen Serie berichte. Experte ist Paul Bradshaw (Twitter), der an der Birmingham City University Online-Journalismus lehrt und das Online Journalism Blog betreibt. Er zeigt mir, wie man Daten automatisiert auslesen kann, nennt mir eine Alternative für den Fall, dass eine Website keinen RSS-Feed oder eigenen Mail-Alert anbietet, und erinnert mich an Möglichkeiten, die ich im Arbeitsalltag oft vergesse.

Mehr

Simon Rogers hat Trost für mich

Doing Journalism with Data - Teil 1: Datenjournalismus-Grundlagen

“Don’t focus on tools, focus on storys”: Paul Bradshaw, britischer Online-Journalist und Blogger, hat mit dieser freundlichen Mahnung mich gemeint. Ganz bestimmt. Denn ich neige dazu, in meiner Begeisterung für neue Werkzeuge schnell mal die eigentliche Geschichte aus den Augen zu verlieren. Die aber steht auch im Datenjournalismus im Vordergrund und am Anfang eines Projekts. Nett von Paul Bradshaw, mich am Ohr zu ziehen und daran zu erinnern.

 Die Krankenschwester Florence Nightingale stellt im 19. Jahrhundert die Todesursachen während des Krimkrieges  als Diagramm dar. Nightingale-mortality  von w:Florence Nightingale (1820–1910). - http://www.royal.gov.uk/output/Page3943.asp. Lizenziert unter Public domain über Wikimedia Commons.


Die Krankenschwester Florence Nightingale zeigt im 19. Jahrhundert, dass im Krimkrieg die meisten Soldaten an Infektionskrankheiten sterben und nicht an Kriegsverletzungen.
Bild: http://www.royal.gov.uk, lizenziert unter Public domain über Wikimedia Commons.

Er ist einer von fünf renommierten Datenjournalisten, bei denen ich in den vergangen Wochen den Online-Intensivkurs “Doing Journalism with Data: First Steps, Skills and Tools”  des European Journalism Centre absolvieren durfte, zusammen mit vielen tausend anderen Teilnehmerinnen und Teilnehmern aus der ganzen Welt. Es war ein MOOC, ein Massive Open Online Course, kostenlos und offen für alle, mit insgesamt 20 Video-Vorträgen in fünf Modulen, jeweils ergänzt durch Zwischentests und sehr rege geführte Forumsdiskussionen, aus denen ebenso viel zu lernen war wie aus den Vorträgen selbst. Der erfolgreiche Abschlusstest wird mit einem Zertifikat belohnt, und ich bin glücklich, meinen letzte Woche bestanden zu haben.

Was ich gelernt habe, will ich hier in einer fünfteiligen Serie aufschreiben. In diesem ersten Teil geht es um die Grundlagen.

Mehr

Hamburger leben länger!

Vorbildlich: Das Max-Planck-Institut für Demografieforschung hat nicht nur herausgefunden, dass die Lebenserwartungen in Deutschland sehr unterschiedlich verteilt ist, sondern stellt auch gleich Rohdaten der Studie inklusive Geodaten zum Download zur Verfügung. So konnte ich recht schnell diese Karte erstellen:

Sie zeigt, wie stark der Anteil von Uralten (das sind jene, die gegen Ende des 19.Jahrhunderts in der jeweiligen Region geboren wurden, im Untersuchungszeitraum von 1989 bis 2002 also 105 Lebensjahre oder mehr auf dem Buckel hatten) nach oben oder unten vom Bundesdurchschnitt abweicht. Und siehe da: An der Küste lebt sich’s länger! Ganz besonders lange leben die Hamburger, die Stadt ist Spitzenreiter mit einem Hochbetagten-Anteil, der um 71 Prozent über dem Durchschnitt liegt.

Mehr

Bornheim ist wieder Bornheim

... und die Geodaten zu Frankfurter Stadtteilen sind aktualisiert

Höhenstraße: Hier beginnt nun wieder Bornheim

Höhenstraße: Hier beginnt nun wieder Bornheim

Der Frankfurter Stadtteil Bornheim ist nun auch offiziell wieder dort Bornheim, wo ja eigentlich immer Bornheim war: Ab der Höhenstraße die Bergerstraße aufwärts. Ende letzten Jahres hat die Stadt die Stadtteilgrenze offiziell in Richtung Südwesten verschoben – dorthin, wo sie nach dem Gefühl der Bornheimer schon immer gehört, an die Höhenstraße. Zuvor gehörte auch der mittlere Teil der Bergerstraße, zwischen Höhenstraße und Bornheim-Mitte gelegen, offiziell zu Nordend-Ost. Wie es einst zu dieser irritierenden Grenzziehung gekommen war, erklärt Stadtkind Ffm hier. Nun also beginnt Bornheim an der Höhenstraße, und Arnsburger-, Petterweil- und mittlere Bergerstraße, der Germaniaplatz und die St.Josefskirche, sie alle sind endlich zu Hause. :)

Anlass für mich, die Geodaten der Frankfurter Stadtteilgrenzen zu aktualisieren. Bei dieser Gelegenheit habe ich auch viele Ungenauigkeiten ausgebessert. Jetzt also ganz frisch und noch besser als vorher:

KML-Daten zum Download

  • KML-Daten: alle Stadtteile von Frankfurt am Main (Download)
  • KML-Daten: Frankfurter Stadtteile, zugeschnitten auf Darstellung von Wahlergebnissen (Download)

Geodaten für Frankfurt am Main: Stadtteile zum Download

Frankfurter Stadtteile

Liebevoll gezeichnet: Frankfurter Stadtteile

Ich weiß jetzt so ungefähr, wie Slartibartfaß sich fühlte, der sein Leben dem Zeichnen von norwegischen Fjorden widmete. Bei mir sind es die Grenzen der 46 Stadtteile von Frankfurt am Main. Mit Hilfe von Google Earth und auf Grundlage dieser Karte habe ich stundenlang Polygone gemalt, bis mir die ganze Stadt vor den Augen verschwamm. Aber es hat sich gelohnt, denn nun kann ich für lokale Visualisierungen immer wieder auf diese Daten zurückgreifen – zum Beispiel, um zu vergleichen, wie es um die Ärztedichte in den einzelnen Stadtteilen steht. Und ihr könnt das auch, denn ich stelle meine Geodaten zum Download zur Verfügung!

Mehr

Wie unsicher ist Frankfurt wirklich?

Frankfurt, Hauptstadt des Verbrechens? Ach, gäjnse mer fodd mit dene olle Glischees. Alle Jahre wieder, wenn das BKA die Kriminalstatistik vorlegt, tönen Medien landauf landab, dass Frankfurt am Main die gefährlichste Stadt Deutschlands sei. Das ist natürlich Unsinn – nicht nur, weil ich in dieser wunderbaren Stadt sehr gerne lebe, sondern vor allem, weil die Zahlen etwas anderes sagen. Lesen muss man sie halt. Aber wer will schon eine knackige Schlagzeile totrecherchieren?

Mehr

Diagramme im Handumdrehen

Datawrapper ist ein Open-Source-Projekt der Akademie für berufliche Bildung der Zeitungsverlage, kurz ABZV. Ich hatte auf der re:publica 2011 erstmals von dem Werkzeug gehört, Anfang 2012 ging die Beta online, im November 2012 erschien die Version 1.0. Mit Datawrapper haben wir Online-Redaktionen nun wirklich keine Ausrede mehr, warum wir aus all den Zahlen und Statistiken, die uns fast täglich auf den Tisch resp. den Bildschirm kommen, nicht mal eben schnell eine ansprechende Grafik zum Einbetten erstellen.

Datawrapper: Prüfen und Beschreiben der Daten

Datawrapper: Prüfen und Beschreiben der Daten

Die Web-Oberfläche von Datawrapper ist sehr übersichtlich und führt Nutzer Schritt für Schritt bis zur fertigen Grafik. Die Daten werden entweder als .csv-Datei hochgeladen oder direkt aus einer Tabelle in das Datenfeld kopiert. Datawrapper stellt sie im nächsten Schritt als Tabelle dar und bietet Optionen unter anderem für das Zahlenformat, aber auch (wichtig!) ein Feld für die Quelle und einen Link dorthin.

Im nächsten Schritt werden die Daten visualisiert. Dabei hat man die Wahl zwischen Balken-, Linien-, Kreis- oder Donut-Diagramm. Wenn man noch keine genaue Vorstellung hat, probiert man einfach mal alles durch – es zeigt sich schnell, welches Chart geeignet ist, um aus den Daten eine informative und verständliche Infografik zu machen.

Mehr

Bad Behavior has blocked 574 access attempts in the last 7 days.