Nicolas Kayser-Bril drückt mir einen Besen in die Hand

Doing Journalism with Data - Teil 4: Messy data - Daten säubern mit OpenRefine

Unterschiedliche Schreibweisen, Abkürzungen oder Zahlenformate, Doubletten, Rechtschreibfehler, überflüssige Leerzeichen, fröhliches Hin und Her zwischen Singular und Plural: “Messy data” ist das täglich Brot des Datenjournalismus. Besonders beim Zusammenführen von Datensätzen aus mehreren Quellen ist das Ergebnis mitunter ein ziemliches Durcheinander. Das weiß der französische Journalist und Programmierer Nicolas Kayser-Bril (Web, Twitter) aus eigener Anschauung, er ist Mitgründer und CEO der Daten-Agentur Journalism++. Im vierten Modul des Online-Kurses “Doing Journalism with Data” schickt er professionelle Reinigungskräfte aufs Feld. Das stärkste Mittel gegen Datenmüll: OpenRefine (ehemals Google Refine).

OpenRefine hilft, Datenchaos zu bereinigen

OpenRefine hilft, Datenchaos zu bereinigen

Mehr

Steve Doig geht mit mir auf Schatzsuche

Doing Journalism with Data - Teil 3: Newsroom-Mathematik mit Excel & Co

Angst vor Mathe? Steve Doig (Twitter) ist genau der Richtige, um sie zu zerstreuen. Wenn der Journalismus-Professor von der Arizona State University und Pulitzer-Preisträger in seiner väterlich-ruhigen Art den Unterschied zwischen Durchschnitt und Median erklärt, verstehe sogar ich das.

Wenn Journalisten sich vor Mathematik fürchten, ist das nicht ganz unbegründet. Nur ein Fehler, eine einzige falsche Berechnung kann erheblich an der Glaubwürdigkeit kratzen. Die gute Nachricht: Es braucht eigentlich nur die Grundrechenarten, um über die Runden zu kommen. Das müsste doch selbst für uns Journalisten zu bewältigen sein …

Mehr

Paul Bradshaw zeigt mir, wie man kratzt

Doing Journalism with Data - Teil 2: Datenquellen und Scraping

Daten finden ist das Thema des zweiten Moduls im Online-Kurs “Doing Journalism with Data”, über den ich hier in einer kleinen Serie berichte. Experte ist Paul Bradshaw (Twitter), der an der Birmingham City University Online-Journalismus lehrt und das Online Journalism Blog betreibt. Er zeigt mir, wie man Daten automatisiert auslesen kann, nennt mir eine Alternative für den Fall, dass eine Website keinen RSS-Feed oder eigenen Mail-Alert anbietet, und erinnert mich an Möglichkeiten, die ich im Arbeitsalltag oft vergesse.

Mehr

Simon Rogers hat Trost für mich

Doing Journalism with Data - Teil 1: Datenjournalismus-Grundlagen

“Don’t focus on tools, focus on storys”: Paul Bradshaw, britischer Online-Journalist und Blogger, hat mit dieser freundlichen Mahnung mich gemeint. Ganz bestimmt. Denn ich neige dazu, in meiner Begeisterung für neue Werkzeuge schnell mal die eigentliche Geschichte aus den Augen zu verlieren. Die aber steht auch im Datenjournalismus im Vordergrund und am Anfang eines Projekts. Nett von Paul Bradshaw, mich am Ohr zu ziehen und daran zu erinnern.

 Die Krankenschwester Florence Nightingale stellt im 19. Jahrhundert die Todesursachen während des Krimkrieges  als Diagramm dar. Nightingale-mortality  von w:Florence Nightingale (1820–1910). - http://www.royal.gov.uk/output/Page3943.asp. Lizenziert unter Public domain über Wikimedia Commons.


Die Krankenschwester Florence Nightingale zeigt im 19. Jahrhundert, dass im Krimkrieg die meisten Soldaten an Infektionskrankheiten sterben und nicht an Kriegsverletzungen.
Bild: http://www.royal.gov.uk, lizenziert unter Public domain über Wikimedia Commons.

Er ist einer von fünf renommierten Datenjournalisten, bei denen ich in den vergangen Wochen den Online-Intensivkurs “Doing Journalism with Data: First Steps, Skills and Tools”  des European Journalism Centre absolvieren durfte, zusammen mit vielen tausend anderen Teilnehmerinnen und Teilnehmern aus der ganzen Welt. Es war ein MOOC, ein Massive Open Online Course, kostenlos und offen für alle, mit insgesamt 20 Video-Vorträgen in fünf Modulen, jeweils ergänzt durch Zwischentests und sehr rege geführte Forumsdiskussionen, aus denen ebenso viel zu lernen war wie aus den Vorträgen selbst. Der erfolgreiche Abschlusstest wird mit einem Zertifikat belohnt, und ich bin glücklich, meinen letzte Woche bestanden zu haben.

Was ich gelernt habe, will ich hier in einer fünfteiligen Serie aufschreiben. In diesem ersten Teil geht es um die Grundlagen.

Mehr

Lieblingsorte: Das Turmzimmer der Weißfrauenkirche

Der Blick aus dem Fenster der Mönchsklause auf die Gutleutstraße

Der Blick aus dem Fenster der Mönchsklause auf die Gutleutstraße im Bahnhofsviertel.

Das Bahnhofsviertel ist einer der kleinsten Stadtteile Frankfurts: Ein gutes Dutzend Straßen, schachbrettartig gezogen auf kaum mehr als einem halben Quadratkilometer, und doch so laut und lebendig, so vielfältig und verrufen wie kein anderes Quartier. Dass auf diesem überschaubaren Fleckchen die ganze Welt zuhause ist, hört sich an wie ein ausgeleiertes Klischee. Aber mit 180 vertretenen Nationen hält es der Wirklichkeit einigermaßen stand.

Hier gibt es alles. Gemüsehändler stopfen ihre Auslagen voll mit exotischen Lebensmitteln. Restaurants bieten Spezialitäten aus allen Kontinenten. Alims Fisch verkauft sich so gut, dass er nach Bockenheim und ins Ostend expandieren konnte. Es gibt türkische Friseure, Hotels jeder Preisklasse, Werbeagenturen, Striplokale, Künstlerateliers, romantische Dachterrassen, Tanzschuppen, Bars, Fixerstuben, eine Freimaurerloge. Und mittendrin sogar eine Mönchszelle.

Mehr

Zeitreise

Altenberger Dom

Altenberger Dom

Da stehe ich an einem sonnigen Frühlingsabend im Tal der Dhünn im Bergischen Land, sehe einen Reiher auf einer saftigen Wiese herumstaksen und weiß plötzlich: Hier bin ich gerade richtig. Dieses Gefühl, zur rechten Zeit am rechten Ort zu sein. Nicht in Gedanken woanders, schon wieder oder immer noch, sondern wunschlos, versenkt an Ort und Stelle wie ein sauber eingeschlagener Nagel in frischem Holz. Eben bin ich aus dem Dom, wo ich Kerzen angezündet habe, in die Abendsonne herausgetreten, und hier draußen hat dieses wunderbare “Alles-ist-gut”-Gefühl auf mich gewartet.

Ein paar Schritte vor mir geht mein Vater. Die Hände hinterm Rücken verschränkt, ein wenig gebeugt, aber immer noch mit entschlossenen Schritten. Vor 56 Jahren, im Mai 1958, hat er hier meine Mutter geheiratet: Im Altenberger Dom, eine Simultankirche, die sie sich ausgesucht hatten, weil er evangelisch und sie katholisch war.

Mehr

Die Hoheit zurückerobern

Die NSA wird uns auch künftig überwachen, wo sie nur kann. Die Bundesregierung wird auch in Zukunft nichts tun, um uns davor zu schützen. Im Gegenteil: Der BND betrachtet die Snowden-Enthüllungen als Machbarkeitsstudie – und will Geld, um all die schönen Technologien anwenden zu können. Und wir? Wir werden unsere Wohnungstüren noch bereitwilliger öffnen für das Internet der Dinge. Für fernüberwachte Rauchmelder und Smart Meter, die unsere Verbrauchsdaten digital an unseren Energieversorger übermitteln – inklusive der Luftfeuchtigkeit im Schlafzimmer. Und wenn er endlich da ist, der vernetzte Kühlschrank, auf den wir schon so lange warten, dann werden wir uns noch wünschen, er würde einfach nur unsere digitale Einkaufsliste verwalten – und nicht auch unsere Essgewohnheiten in die Welt twittern.

Ist das eine Kapitulation? Nö. Zunächst einmal ist es nicht mehr als die Erkenntnis, dass sich die Digitalisierung trotz Risiken und Nebenwirkungen fortsetzen wird – viel zu viele gute Gründe gibt es dafür. Da genügt ein Blick auf das saftige Grün meiner Pflanzen, die sehr viel besser gepflegt werden, seit mein Wlan-Pflanzensitter mir eine Pushnachricht aufs Smartphone schickt, wenn die Erde zu trocken oder Temperatur und Lichtverhältnisse ungünstig sind. Und auf das selbstfahrende Auto, das mich vor meiner Tür absetzt und dann eigenständig raus aus der Stadt kutschiert, freue ich mich jedesmal, wenn ich wieder mal Runde um Runde auf der Suche nach einem Parkplatz drehe.

Mehr

Kurz geknipst

#meinfrankfurt

#meinfrankfurt im Norden

#meinfrankfurt im Norden – zwischen Heiligenstock und Bad Vilbel

Bad Behavior has blocked 421 access attempts in the last 7 days.