Loading...

Wie wurden die Daten gesammelt? Ein paar Fragen an Luca Hammer

Für den Digitalreport wurden Millionen von Facebook-Daten analysiert. Wie bist du zu den Daten gekommen?

Luca Hammer Alle Daten wurden über die Programmierschnittstelle von Facebook erfasst, kurz „API“ genannt. Das kann  jeder machen: Man meldet sich dafür an, schreibt ein passendes  Programm und kann dann öffentliche Daten abrufen.

Welche Daten kann man denn so abrufen?

L.H. Grundsätzlich geht es um alle öffentlichen Daten von Facebook-Pages, also deren Beiträge, die Anzahl der Likes, Kommentare und Shares – auch die Inhalte von Kommentaren. Nicht jedoch wer eine Page oder einzelne Beiträge likt. Auch andere relevante personenbezogene Daten sind nicht mehr abrufbar.

Inwiefern? Welche Daten waren denn früher abrufbar?

L.H. Vergangenes Jahr konnte man noch die Namen jener Profile abrufen, die auf Facebook-Seiten mitdiskutierten. So konnte man schauen, ob auf politischen Seiten nur eine kleine, lautstarke Minderheit aktiv ist oder wirklich viele unterschiedliche User das Wort ergreifen. Um diese Frage zu beantworten,  analysierten wir Daten aus 2017 und sahen: Es sind nur ein paar hundert Accounts, die für zigtausend Kommentare verantwortlich sind.

All diese Datenberge erlauben also genauere Schlüsse?

L.H. Genau. Mit solchen Daten lässt sich ein besserer Vergleich anstellen, wie die Parteien auf Facebook kommunizieren. Ich fand zum Beispiel interessant, dass alle Parteien schon relativ lang Facebook nutzen und dort viel posten – aber unterschiedlich erfolgreich sind. Heinz-Christian Strache erntet schon lange viel Interaktion auf Facebook, wohingegen ÖVP und SPÖ erst in letzter Zeit zulegten. Der scheinbare Erfolg auf Facebook kann auch damit zusammenhängen, wieviel Geld eine Partei in Facebook-Werbung steckt. Das lässt sich von außen nicht erkennen.

Kann man die Ergebnisse des Digitalreports reproduzieren?

L.H. Ja. Das Python-Script, das ich zum Sammeln der Daten schrieb, kann jeder unter github.com/Digitalreport herunterladen, damit selbst Facebook-Daten sammeln und auswerten. Das Ganze ist Open Source – also frei einsehbar und nutzbar.

 

Zur Person:

Luca Hammer ist Datenanalyst und Programmierer. Für deutsche Medien und Initiativen  führt er Auswertungen durch, darunter ZDFneo und Fearless Democracy. Siehe: lucahammer.com

>> Über die Herausforderungen bei der Arbeit mit Facebook-Daten hat Luca Hammer auch hier einen Fachbeitrag geschrieben.

Methodik: Die Daten wurden über die offizielle Programmierschnittstelle (API) von Facebook erhoben und mit Python-Skripten  für die Auswertung mit Excel und Gephi vorbereitet. Erhobener Zeitraum: 1. Januar bis 1. Juni 2018  (abgerufen zwischen 11. Juni und 2. Juli 2018). 

Zur Analyse der User-Kommentare wurden Daten aus 2017  analysiert, die freundlicherweise Josef Holnburger  zur Verfügung stellte. Diese Daten wurden von Holnburger mit dem Tool netvizz am 14. 10. 2017 erfasst. Gesammelt wurden alle Kommentare zu den letzten 1000 Beiträgen je Facebook-Page (betrachtet wurden alle Parlamentsparteien und ihre Spitzenkandidatinnen und Spitzenkandidaten). Ausgewertet wurden von uns nur Kommentare aus dem Jahr 2017 und keine Kommentare aus den Vorjahren.

 

No Comments

    Leave a Reply