RSS-Feed
Datenjournalismus

Datenjournalismus: Wenn Journalisten tief in Datenbergen schürfen

Um Daten zu sammeln und auszuwerten, muss man kein Wissenschaftler sein. Auch Journalisten können das – wenn sie sich in die Welt der Tabellenkalkulation hineintrauen. Bernd Oswald erklärt den Weg von der Tabelle bis zur fertigen Geschichte in fünf Schritten.

Journalisten haben schon immer mit Daten gearbeitet. Allerdings gibt es heutzutage zu fast jedem Thema ungleich viel mehr Daten als früher und noch dazu jede Menge Software, um diese Daten auszuwerten und (optisch) aufzubereiten. Deshalb müssen Journalisten heute in der Lage sein, sich in der Menge an Daten zurechtzufinden, Daten zu recherchieren und zu interpretieren. Dieser Datenjournalismus ist vor allem eine Recherchetechnik und gehört im Digitalzeitalter in den journalistischen Werkzeugkasten.

Dabei ist Datenjournalismus ein sehr weites Feld mit vielen Abstufungen. Im Wesentlichen gibt es drei Kategorien, die unterschiedlich tief in die Materie einsteigen:

  1. Die erste Stufe sind einfache Datenvisualisierungen (z. B. Torten- und Balkendiagramme), wie wir sie von Wahlergebnissen kennen.
  2. Auf der nächsten Ebene geht es darum, Datensätze zu recherchieren, zu analysieren und (meistens) zu visualisieren, immer eingebettet in einen erläuternden Text.
  3. Die Skala geht bis zum investigativen Datenjournalismus, bei dem interdisziplinäre Teams aus Journalisten, Programmierern und Co mitunter wochenlang in Datenbergen schürfen und so eine Geschichte zutage fördern, die sie mit interaktiven Datenvisualisierungen untermauern. “Correctiv” arbeitet oft so.

Natürlich gibt es auch viele Beispiele, die irgendwo dazwischen liegen, die Übergänge sind häufig fließend.

Hier konzentrieren wir uns auf die zweite Kategorie, an die sich jeder (Fach-)Journalist heranwagen kann. Der Weg vom Datensatz bis zur fertigen Story besteht dabei aus fünf Schritten.

1. Schritt: Ausgangsfrage stellen oder These formulieren

Natürlich gibt es den Ansatz, komplett ergebnisoffen an einen oder mehrere (große) Datensätze heranzugehen, die Daten gründlich auszuwerten und erst dann zu entscheiden, was die Geschichte ist. Dieser Ansatz wird oft beim investigativen Datenjournalismus gewählt.

Meist stellen Journalisten aber Thesen auf, die sie durch ihre Recherche verifizieren wollen. Das ist auch die häufigste Herangehensweise im Datenjournalismus. Auch hier – bei der zweiten Kategorie, den Datengeschichten – kann es passieren, dass die Daten die Ausgangsthese nicht stützen oder gar etwas Gegenteiliges aussagen. Dann muss man entweder die Geschichte entsprechend anders aufbereiten oder eben ganz sein lassen.

Nehmen wir an, Sie sind ein Autojournalist, der sich die Frage stellt: Ist Autofahren in den letzten 30 Jahren sicherer geworden? Das ist die Hauptfrage. Um sie beantworten zu können, stellt sich eine Reihe von Nebenfragen:

  • Wie hat sich die Zahl der Unfälle entwickelt?
  • Wie viele Personen sind bei Unfällen ums Leben gekommen?
  • Wie viele Personen sind bei Unfällen verletzt worden – und wie schwer?
  • Wie verteilen sich die Unfälle auf Kollisionen mit anderen Fahrzeugen, Fahrrädern, Personen und Hindernissen?
  • Auf welchem Straßentyp (z. B. innerörtliche Straße, Landstraße, Autobahn) kam es zu den Unfällen?
  • Wie viele Unfälle ereigneten sich innerorts, wie viele außerorts?
  • Wie hoch war die Geschwindigkeit der Unfallteilnehmer?
  • Wie viele Personen waren bei den Unfällen beteiligt?
  • Wie viele Personenkilometer sind gefahren worden?
  • Wie alt waren die beteiligten Fahrzeuge und über welche Sicherheitsmerkmale verfügten sie?

Je nach Erkenntnisinteresse werden Sie weitere Fragen hinzufügen oder weglassen.

2. Schritt: Daten recherchieren

Nun geht es darum, die entsprechenden Daten zu recherchieren. In unserem Fall führen Ämter und Behörden die entsprechenden Statistiken. Konkret wären das:

  • das Statistische Bundesamt
  • Statistische Landesämter
  • das Kraftfahrbundesamt
  • das Bundesverkehrsministerium
  • Landesverkehrsministerien

Je nachdem, wie weit die Daten herunter gebrochen werden sollen, kommen auch Kommunen und Landkreise ins Spiel.

Als Nächstes erfolgt die Kontaktaufnahme zu den entsprechenden Pressestellen. Sie sind gut beraten, die Frage, auf die Sie statistische Antworten haben möchten, möglichst konkret zu stellen, damit die Behörden die richtige Statistik heraussuchen – so sie nicht ohnehin online steht. Sie sollten auch darauf dringen, die Statistik in einem maschinenlesbaren Format wie .xls (Excel-Dokument), .csv (comma-separated values) oder .tsv (table-separated values) zu bekommen, denn mit beispielsweise einem PDF wird die Datenauswertung ungleich umständlicher.

3. Schritt: Daten strukturieren und säubern

Sie haben nun verschiedene Datensätze erhalten, idealerweise als Excel-Datei. Je nachdem, wie die Fragestellung genau aussieht, suchen Sie jetzt in den Datensätzen nach Antworten. Da es bei der Hauptfrage “Ist Autofahren in den letzten 30 Jahren sicherer geworden?” um eine Entwicklung geht, sind hier Zeitreihen interessant. Nun schlägt die Stunde der Tabellenkalkulationsprogramme: Excel, Numbers, LibreOffice, Google Tabellen. Jedes hat seine Stärken und Schwächen; Microsoft Excel ist am häufigsten verbreitet.

Zur Sicherheit sollten Sie als Erstes eine Kopie des Original-Datensatzes speichern, in der Sie nach Lust und Laune herumfuhrwerken können. Das Original steht für den Notfall parat, falls Sie beim Bearbeiten etwas versehentlich gelöscht haben oder ihr Programm einmal abgestürzt ist.

Nun geht es daran, alle überflüssigen Daten auszusortieren, im Beispiel die Jahre vor 1985, oder weitere Werte, die nicht benötigt werden. Je weniger Reihen und Spalten Sie haben, desto übersichtlicher ist Ihr Dokument und desto leichter werden Sie sich dort zurechtfinden. Es kann erforderlich sein, Daten aus verschiedenen Dateien in einer Datei zusammenzuführen. Das geht nur, wenn auch die Reihen identisch sind.

Ein Beispiel: Die Werte für Verkehrsunfälle im Bundesland, im Landkreis und in der Stadt liegen in drei Dateien. Sie legen eine neue Datei an und kopieren aus jeder der drei Ursprungsdateien die Werte ab 1985 in die neue Datei. Die Jahre sind hier also der gemeinsame Nenner.

Achten Sie auch auf einheitliche Schreibweisen: Die gleiche Sache muss auch exakt gleich benannt sein, sonst ist die Verwirrung groß! Entscheiden Sie sich also für eine der Alternativen, zum Beispiel “Garmisch-Partenkirchen” oder “Markt Garmisch-Partenkirchen”, und ziehen Sie diese Schreibweise konsequent durch.

Unterschätzen Sie diesen Schritt nicht: Nur ein sauberer Datensatz liefert verlässliche Ergebnisse – und spart Ihnen Nerven.

4. Schritt: Daten filtern und analysieren

Der Kern allen datenjournalistischen Arbeitens ist die Datenanalyse. Hier geht es darum, die Geschichte in den Daten zu finden. Es gibt viele typische Arten von Datengeschichten:

Im Beispiel “Autofahren” ist vor allem der Trend interessant: Wie haben sich die Unfallzahlen seit 1985 entwickelt? Neben den absoluten Zahlen sind hier relative Werte interessant: Bei wie vielen Prozent der Unfälle hat es Tote gegeben? Wie viele Prozent der Unfälle ereigneten sich in Ortschaften? Hier kommt eine grundlegende und für viele Datengeschichten eminent wichtige Funktion ins Spiel: die Prozentrechnung.

Excel und Co erledigen die Berechnung im Handumdrehen. Sie legen am besten eine neue Spalte an, geben dort eine Funktion ein, etwa nach dem Muster “=B1/C1″, und drücken Return. Dann teilt Excel den Wert, der im Feld B1 steht (z. B. Unfälle mit Toten), durch den Wert, der im Feld C1 steht (z. B. Gesamtzahl der Unfälle). Praktisch: Mit einem Klick auf die rechte untere Ecke des Feldes, in dem das Ergebnis steht, wird diese Rechnung für alle Reihen, in diesem Fall alle Jahre, übernommen.

So können Sie – je nach Datenlage – immer spezifischere Fragen an ihren Datensatz stellen, immer tiefer in die Materie eintauchen und weitere Befunde zutage fördern. Stellen Sie sich die Datenanalyse wie einen Felsblock vor, aus dem ein Künstler eine Skulptur schafft. Er schlägt zuerst große Stücke ab und verfeinert sein Werk dann immer weiter, bis ein klar erkennbares Gesicht zu sehen ist.

Paul Bradshaw erklärt in seinem E-Book „Finding stories with Spreadsheets“ sehr praxisnah, wie man Excel nutzt, um Geschichten in Datensätzen zu finden.

Paul Bradshaw erklärt in seinem E-Book “Finding stories with Spreadsheets” sehr praxisnah, wie man Excel nutzt, um Geschichten in Datensätzen zu finden.

Excel bietet zig Funktionen, die man als Journalist nicht alle braucht. Dennoch ist es für Datenjournalisten notwendig, ein bisschen mehr als die absoluten Grundfunktionen zu beherrschen. Eine hervorragende und praxisnahe Einführung in Excel für Journalisten liefert der britische Journalismus-Coach Paul Bradshaw in seinem E-Book “Finding stories with Spreadsheets“. Der Vorteil: Er aktualisiert es immer wieder.

5. Schritt: Befunde aufbereiten und veröffentlichen

Wenn Sie Ihren Datensatz eine Zeit lang auf diese Weise bearbeiten, bekommen Sie Antworten auf die Fragen, die Ausgangspunkt Ihrer Recherche waren. Nun wissen Sie also zum Beispiel, dass die Gesamtzahl der Unfälle mit Schwerverletzten oder Toten rückläufig ist, obwohl mehr Kilometer gefahren wurden. Die Befunde können jetzt ganz klassisch aufgeschrieben werden. Oft sind sie auch eine gute Ausgangsbasis für weitere Recherchen, etwa, wann Airbags serienmäßig oder Fahrassistenzsysteme eingeführt wurden.

Die Rhein-Zeitung hat die Koblenzer Verkehrsunfallstatistik 2013 mit Datawrapper visualisiert.

Die Rhein-Zeitung hat die Koblenzer Verkehrsunfallstatistik 2013 mit Datawrapper visualisiert.

Ein weiterer naheliegender Schritt ist, die Daten zu visualisieren. Dies kann mit einem einfachen Liniendiagramm erfolgen, wie es sich beim Unfallbeispiel anbietet. Solche Diagramme lassen sich schon mit Tabellenkalkulationsprogrammen erstellen. Wer es etwas schicker haben will, kann auf Software wie Adobe Illustrator, Datawrapper oder Infogram zugreifen. Die beiden letztgenannten Tools bieten den Vorteil, dass sie interaktiv sind und auf jeder Website eingebunden werden können.

Fazit

Es gibt sehr viele Spielarten beim Datenjournalismus. Seine Bedeutung wird sicher zunehmen, weil in fast allen Bereichen des öffentlichen Lebens mehr Daten erhoben und (online) zur Verfügung gestellt werden. Insofern ist datenjournalistisches Know-how eine Schlüsselkompetenz für moderne Journalisten. Wer selbst Daten recherchiert, analysiert und visuell aufbereitet, muss nicht Studien und PR-Zahlen nachbeten, sondern kann solche Zahlen hinterfragen und nach tiefer liegenden Geschichten suchen.

Titelillustration: Esther Schaarhüls

Das Magazin Fachjournalist ist eine Publikation des Deutschen Fachjournalisten-Verbands (DFJV).

Foto: Andreas Unger

Foto: Andreas Unger

Der Autor Bernd Oswald ist freier Medienjournalist, Trainer und Trendscout im digitalen Journalismus. Er glaubt an die Macht der Daten für aussagekräftige Geschichten und eine transparentere Gesellschaft. Deswegen engagiert er sich bei Code for München und hat die Datenjournalismus-Mailingliste www.ddjdach.de mit ins Leben gerufen. Darüber hinaus zählt er zu den Gründern von Hacks/Hackers München, wo Journalisten und Programmierer neue Formate diskutieren und konzipieren. Zu diesen Themen twittert er als @berndoswald und bloggt auf www.journalisten-training.de.

Kommentare sind geschlossen.