Paul Bradshaw zeigt mir, wie man kratzt

Doing Journalism with Data - Teil 2: Datenquellen und Scraping

Daten finden ist das Thema des zweiten Moduls im Online-Kurs “Doing Journalism with Data”, über den ich hier in einer kleinen Serie berichte. Experte ist Paul Bradshaw (Twitter), der an der Birmingham City University Online-Journalismus lehrt und das Online Journalism Blog betreibt. Er zeigt mir, wie man Daten automatisiert auslesen kann, nennt mir eine Alternative für den Fall, dass eine Website keinen RSS-Feed oder eigenen Mail-Alert anbietet, und erinnert mich an Möglichkeiten, die ich im Arbeitsalltag oft vergesse.

Mehr

Simon Rogers hat Trost für mich

Doing Journalism with Data - Teil 1: DDJ-Grundlagen
 Die Krankenschwester Florence Nightingale stellt im 19. Jahrhundert die Todesursachen während des Krimkrieges  als Diagramm dar. Nightingale-mortality  von w:Florence Nightingale (1820–1910). - http://www.royal.gov.uk/output/Page3943.asp. Lizenziert unter Public domain über Wikimedia Commons.


Die Krankenschwester Florence Nightingale zeigt im 19. Jahrhundert, dass im Krimkrieg die meisten Soldaten an Infektionskrankheiten sterben und nicht an Kriegsverletzungen.
Bild: http://www.royal.gov.uk, lizenziert unter Public domain über Wikimedia Commons.

 

“Don’t focus on tools, focus on storys”: Paul Bradshaw, britischer Online-Journalist und Blogger, hat mit dieser freundlichen Mahnung mich gemeint. Ganz bestimmt. Denn ich neige dazu, in meiner Begeisterung für neue Werkzeuge schnell mal die eigentliche Geschichte aus den Augen zu verlieren. Die aber steht auch im Datenjournalismus im Vordergrund und am Anfang eines Projekts. Nett von Paul Bradshaw, mich am Ohr zu ziehen und daran zu erinnern.

Er ist einer von fünf renommierten Datenjournalisten, bei denen ich in den vergangen Wochen den Online-Intensivkurs “Doing Journalism with Data: First Steps, Skills and Tools”  des European Journalism Centre absolvieren durfte, zusammen mit vielen tausend anderen Teilnehmerinnen und Teilnehmern aus der ganzen Welt. Es war ein MOOC, ein Massive Open Online Course, kostenlos und offen für alle, mit insgesamt 20 Video-Vorträgen in fünf Modulen, jeweils ergänzt durch Zwischentests und sehr rege geführte Forumsdiskussionen, aus denen ebenso viel zu lernen war wie aus den Vorträgen selbst. Der erfolgreiche Abschlusstest wird mit einem Zertifikat belohnt, und ich bin glücklich, meinen letzte Woche bestanden zu haben.

Was ich gelernt habe, will ich hier in einer fünfteiligen Serie aufschreiben.

Mehr

Hamburger leben länger!

Vorbildlich: Das Max-Planck-Institut für Demografieforschung hat nicht nur herausgefunden, dass die Lebenserwartungen in Deutschland sehr unterschiedlich verteilt ist, sondern stellt auch gleich Rohdaten der Studie inklusive Geodaten zum Download zur Verfügung. So konnte ich recht schnell diese Karte erstellen:

Sie zeigt, wie stark der Anteil von Uralten (das sind jene, die gegen Ende des 19.Jahrhunderts in der jeweiligen Region geboren wurden, im Untersuchungszeitraum von 1989 bis 2002 also 105 Lebensjahre oder mehr auf dem Buckel hatten) nach oben oder unten vom Bundesdurchschnitt abweicht. Und siehe da: An der Küste lebt sich’s länger! Ganz besonders lange leben die Hamburger, die Stadt ist Spitzenreiter mit einem Hochbetagten-Anteil, der um 71 Prozent über dem Durchschnitt liegt.

Mehr

Bornheim ist wieder Bornheim

... und die Geodaten zu Frankfurter Stadtteilen sind aktualisiert
Höhenstraße: Hier beginnt nun wieder Bornheim

Höhenstraße: Hier beginnt nun wieder Bornheim

Der Frankfurter Stadtteil Bornheim ist nun auch offiziell wieder dort Bornheim, wo ja eigentlich immer Bornheim war: Ab der Höhenstraße die Bergerstraße aufwärts. Ende letzten Jahres hat die Stadt die Stadtteilgrenze offiziell in Richtung Südwesten verschoben – dorthin, wo sie nach dem Gefühl der Bornheimer schon immer gehört, an die Höhenstraße. Zuvor gehörte auch der mittlere Teil der Bergerstraße, zwischen Höhenstraße und Bornheim-Mitte gelegen, offiziell zu Nordend-Ost. Wie es einst zu dieser irritierenden Grenzziehung gekommen war, erklärt Stadtkind Ffm hier. Nun also beginnt Bornheim an der Höhenstraße, und Arnsburger-, Petterweil- und mittlere Bergerstraße, der Germaniaplatz und die St.Josefskirche, sie alle sind endlich zu Hause. :)

Anlass für mich, die Geodaten der Frankfurter Stadtteilgrenzen zu aktualisieren. Bei dieser Gelegenheit habe ich auch viele Ungenauigkeiten ausgebessert. Jetzt also ganz frisch und noch besser als vorher:

KML-Daten zum Download

  • KML-Daten: alle Stadtteile von Frankfurt am Main (Download)
  • KML-Daten: Frankfurter Stadtteile, zugeschnitten auf Darstellung von Wahlergebnissen (Download)

Google reicht nicht mehr

So viel Visualisierung war nie wie bei der Bundestagswahl 2013: Die Berliner Morgenpost erstellte eine vielgelobte Berlin-Wahlkarte, Zeit online machte aus der Landkarte Deutschlands eine Karte von Wahlland. Am besten gefällt mir der Wahlatlas von Michael Neutz:   Er ist intutiv zu bedienen, zeigt mir schnell, was ich wissen will (zum Beispiel die Wahlkreis-Hochburgen einer bestimmten Partei) und bietet mehrere Zugangswege zu den Daten, bis hin zu der Möglichkeit, die Darstellung der Häufigkeiten auf der Deutschlandkarte anhand von eigenen Werten zu verändern.

Im Blog von Open Data City sind noch viele weitere Beispiele gesammelt. Meine Wahlkarten für Frankfurt am Main sind nicht dabei. Das hat schon seine Richtigkeit, denn längst sind, wie die Linksammlung beweist, viel komplexere Visualisierungen möglich als jene, die ich mit Hilfe von Google in der Wahlnacht erstellt habe.

Aber was hätte ich machen sollen – ich war jung und hatte ja nichts außer Google! Immerhin: Mit Fusion Tables, dynamischen Templates (für die Info-Fenster) und dem Image Chart Editor (für die Balkendiagramme) konnte ich interaktive Wahlkreis- und Stadtteilkarten für Frankfurt machen, die es sonst nirgends gab, und mit allen wichtigen Informationen versehen, darunter der Wahlkreis-Gewinner, die Verteilung der Erststimmen auf die Direktkandidaten und das Zweitstimmen-Ergebnis als Chart. Letzteres generierte sich dynamisch aus den Parteiergebnissen in meiner Tabelle (hier steht, wie das geht).

Allerdings war vor allem die Sache mit den dynamischen Charts eine Zitterpartie, denn Google stellt den Dienst in Kürze ein. Auch deshalb stellt sich für mich immer drängender die Frage: Ist es wirklich noch klug, sich bei Visualisierungsprojekten auf die Werkzeuge von Google zu verlassen? Nachhaltige Projekte laufen immer Gefahr,  ihre Funktionalität zu verlieren, falls Google sich entschließt, den in Anspruch genommenen Dienst zu beerdigen (womit man ja immer rechnen muss). Und selbst, wenn das nicht der Fall ist, bleibt trotz guter Vorbereitung immer eine Unsicherheit: Wird das Tool funktionieren? Oder schlägt zum Beispiel gerade dann, wenn es darauf ankommt, der Upload einer Datentabelle fehl: “Try again later!”? Ein Alptraum, zumindest an Wahlabenden.

Mehr

Karten-Visualisierung: Drei Tools im Test

Wenn es in Statistiken um Ländervergleiche geht, bietet sich oft eine Heatmap oder Choroplethenkarte zur besseren Verständlichkeit an – eine Gebietsstufenkarte, auf der die verschiedenen Länder oder Regionen je nach Wert unterschiedlich intensiv eingefärbt sind. Regionale Unterschiede oder auch mögliche Zusammenhänge lassen sich damit auf einen Blick erfassen. Dieser Tage legte das Statistische Bundesamt zum Beispiel Zahlen aus 2010 zur Armutsgefährdung in den EU-(und einigen Nicht-EU-)Staaten vor – eine Gelegenheit, mal das eine oder andere Werkzeug für das Erstellen interaktiver Karten jenseits von Google Fusion Tables zu testen. Angeschaut habe ich mir OpenHeatMap, CartoDB und Tableau Public.

Mehr

Wie unsicher ist Frankfurt wirklich?

Frankfurt, Hauptstadt des Verbrechens? Ach, gäjnse mer fodd mit dene olle Glischees. Alle Jahre wieder, wenn das BKA die Kriminalstatistik vorlegt, tönen Medien landauf landab, dass Frankfurt am Main die gefährlichste Stadt Deutschlands sei. Das ist natürlich Unsinn – nicht nur, weil ich in dieser wunderbaren Stadt sehr gerne lebe, sondern vor allem, weil die Zahlen etwas anderes sagen. Lesen muss man sie halt. Aber wer will schon eine knackige Schlagzeile totrecherchieren?

Mehr

Diagramme im Handumdrehen

Datawrapper ist ein Open-Source-Projekt der Akademie für berufliche Bildung der Zeitungsverlage, kurz ABZV. Ich hatte auf der re:publica 2011 erstmals von dem Werkzeug gehört, Anfang 2012 ging die Beta online, im November 2012 erschien die Version 1.0. Mit Datawrapper haben wir Online-Redaktionen nun wirklich keine Ausrede mehr, warum wir aus all den Zahlen und Statistiken, die uns fast täglich auf den Tisch resp. den Bildschirm kommen, nicht mal eben schnell eine ansprechende Grafik zum Einbetten erstellen.

Datawrapper: Prüfen und Beschreiben der Daten

Datawrapper: Prüfen und Beschreiben der Daten

Die Web-Oberfläche von Datawrapper ist sehr übersichtlich und führt Nutzer Schritt für Schritt bis zur fertigen Grafik. Die Daten werden entweder als .csv-Datei hochgeladen oder direkt aus einer Tabelle in das Datenfeld kopiert. Datawrapper stellt sie im nächsten Schritt als Tabelle dar und bietet Optionen unter anderem für das Zahlenformat, aber auch (wichtig!) ein Feld für die Quelle und einen Link dorthin.

Im nächsten Schritt werden die Daten visualisiert. Dabei hat man die Wahl zwischen Balken-, Linien-, Kreis- oder Donut-Diagramm. Wenn man noch keine genaue Vorstellung hat, probiert man einfach mal alles durch – es zeigt sich schnell, welches Chart geeignet ist, um aus den Daten eine informative und verständliche Infografik zu machen.

Mehr

Jüdische Frankfurter – und was aus ihnen wurde

Stolpersteine für Hermann und Paula Eschwege

Stolpersteine auf dem Weg zu meiner Arbeit: Hermann und Paula Eschwege wohnten in der Wittelsbacher Allee. Ihre Geschichte beim Klick aufs Bild.

Wohl fast jeder, der mit offenen Augen durch Deutschlands Straßen geht, ist schon einmal über einen dieser messingfarbenen Pflastersteine für Opfer des Nationalsozialismus gestolpert: “Hier wohnte” steht darauf eingraviert, gefolgt von einem Namen, dem Geburtsdatum, dem Ziel der Deportation und, soweit bekannt, dem Todesdatum. Bis zum Jahresende werden 38.000 davon verlegt sein, die meisten in Deutschland, aber auch in vielen anderen Ländern Europas – eine mit Preisen bedachte Initiative des Künstlers Gunter Demnig.

Aus Frankfurt am Main wurden etwa 12.000 Menschen deportiert, die meisten in den Jahren 1941 bis 1945. An 700 von ihnen erinnert jeweils ein Stolperstein, eingelassen in das Pflaster vor dem letzten Wohnhaus. Doch können diese Zahlen wirklich einen Eindruck davon vermitteln, wie viele Frauen, Männer und Kinder in dieser Zeit gewaltsam aus ihrem Leben und aus der Mitte einer Stadtgesellschaft gerissen wurden? Die Opfer der Nazis lebten nicht irgendwo abgeschirmt, sondern waren Nachbarinnen und Nachbarn, im Westend, in Bockenheim, im Gallus, in Sachsenhausen, im Nordend, in Eschersheim, im Ostend, in Höchst. Wohin wurden sie verschleppt, nachdem die Nazi-Schergen sie im Morgengrauen aus ihren Wohnungen geholt und zu Sammelstellen wie der Großmarkthalle getrieben hatten? Wie viele Menschen deportierte die Gestapo nach Theresienstadt, nach Lodz, Kaunas, nach Auschwitz, Majdanek und in andere Ghettos und Konzentrationslager? Wem gelang die Flucht? Wie viele nahmen sich das Leben?

Mehr

Good morning, America

Um 5:20 Uhr konnte ich beruhigt einschlafen.*

Obamas Rede nach der Wahl, erstellt mit Wordle

Obamas Rede nach der Wahl, erstellt mit Wordle

Romneys Rede nach der Wahl, erstellt mit Wordle

Romneys Rede nach der Wahl, erstellt mit Wordle

* Bis die Handwerker klingelten.

Bad Behavior has blocked 16143 access attempts in the last 7 days.