{"id":230,"date":"2018-02-13T16:58:34","date_gmt":"2018-02-13T15:58:34","guid":{"rendered":"https:\/\/www.digitalreport.at\/?p=230"},"modified":"2018-02-13T16:58:34","modified_gmt":"2018-02-13T15:58:34","slug":"datenanalyse-im-zeitalter-sozialer-netzwerke","status":"publish","type":"post","link":"https:\/\/www.digitalreport.at\/report-facebook\/2018\/02\/13\/datenanalyse-im-zeitalter-sozialer-netzwerke\/","title":{"rendered":"Datenanalyse im Zeitalter sozialer Netzwerke"},"content":{"rendered":"<p><strong><a href=\"https:\/\/www.digitalreport.at\/wp-content\/uploads\/2018\/07\/digitalreport-cover-weiss-ausschnitt.png\"><div style=\"width: 181px;\" data-width=\"181\" class=\"ratio-wrap-left\"><div class=\"ratio-box\" style=\"padding-bottom: 200.55248618785% !important;\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft wp-image-232 lazyload\" alt=\"\" width=\"181\" height=\"363\" data-src=\"https:\/\/www.digitalreport.at\/wp-content\/uploads\/2018\/07\/digitalreport-cover-weiss-ausschnitt.png\" data-srcset=\"https:\/\/www.digitalreport.at\/report-facebook\/wp-content\/uploads\/sites\/4\/2018\/07\/digitalreport-cover-weiss-ausschnitt.png 252w, https:\/\/www.digitalreport.at\/report-facebook\/wp-content\/uploads\/sites\/4\/2018\/07\/digitalreport-cover-weiss-ausschnitt-150x300.png 150w, https:\/\/www.digitalreport.at\/report-facebook\/wp-content\/uploads\/sites\/4\/2018\/07\/digitalreport-cover-weiss-ausschnitt-75x150.png 75w\" data-sizes=\"(max-width: 181px) 100vw, 181px\"><\/img><\/div><\/div><\/a>Wie einfach und doch schwierig das Erstellen von Datenanalysen ist, erkl\u00e4rt Luca Hammer. Denn zunehmend l\u00e4sst sich beobachten, dass Facebook den Zugriff auf seine Daten einschr\u00e4nkt.<\/strong><\/p>\n<p>Lange Zeit waren Datenerhebungen \u00e4u\u00dferst aufw\u00e4ndig. Man musste die chaotische Welt in einfache Skalen verwandeln. Etwa durch Umfragen oder Beobachtungen. Im Internet wird die Vermessung der Kommunikation hingegen einfacher: Bei sozialen Netzwerken wie Facebook oder Twitter liegen die Daten bereits in digitaler Form vor. Wenn die jeweilige Plattform es zul\u00e4sst, k\u00f6nnen die dort \u00f6ffentlich geposteten Daten mit einigen Zeilen Programmcode erhoben und f\u00fcr die Auswertung genutzt werden. Plattformen wie Facebook, Twitter und YouTube bieten solche Schnittstellen an: Informatiker, Journalisten, Wissenschaftler k\u00f6nnen damit automatisiert \u00f6ffentliche Daten der Plattform erfassen und dann auswerten.<\/p>\n<p>Statt Stichproben k\u00f6nnen bei sozialen Medien Vollerhebungen durchgef\u00fchrt werden. Jeder \u00f6ffentliche Beitrag, jeden Kommentar und jede Reaktion in den letzten zehn Jahren k\u00f6nnten erfasst und ausgewertet werden. \u201eK\u00f6nnten\u201c, weil die Plattformen nicht (mehr) Zugriff auf alles geben.<!--more--><\/p>\n<p>Bei Facebook hat sich ein radikaler Wandel vollzogen: Als das Unternehmen damit begann Apps von Drittentwicklern auf der Facebook-Plattform zuzulassen, gab es wenige Einschr\u00e4nkungen. Wer einer App Zugriff auf sein Profil gab, erm\u00f6glichte ihr auch Zugriff auf alle Daten, die die Person selbst sehen konnte. Etwa private Bilder oder Nachrichten von Kontakten. Um abzufragen, ob zwei Accounts miteinander verbunden waren, reichte die ID der Accounts aus. Diese Offenheit war ein Faktor f\u00fcr den Erfolg Facebooks, weil Entwickler scharenweise Apps f\u00fcr die Facebook-Plattform entwickelten. Bis heute ist der Facebook-Login \u00e4u\u00dferst beliebt bei App-Entwicklern. Zugleich hatte diese Offenheit eine gro\u00dfe Schattenseite: Sie erm\u00f6glichte Datenskandale wie jener der SCL Group (Cambridge Analytica). Facebook hat genau betrachtet fr\u00fch auf derartige Probleme reagiert. Statt Vollzugriff auf das Profil und die Daten von Kontakten zu geben konnte Zugriff auf einzelne Bereiche gegeben werden. Name und Profil sind immer \u00f6ffentlich, dar\u00fcber hinaus kann der Zugriff auf Informationen wie die Mailadresse, das Geschlecht oder die Likes gegeben werden. Auch <a href=\"https:\/\/developers.facebook.com\/docs\/facebook-login\/permissions\" target=\"_blank\" rel=\"noopener\">Schreibrechte<\/a> sind m\u00f6glich. Diese werden zum Ver\u00f6ffentlichen von Inhalten ben\u00f6tigt. Sp\u00e4ter wurden die einzelnen Berechtigungen optional gemacht, sodass es den Userinnen und Usern m\u00f6glich war, Apps zu nutzen ohne alle Daten freizugeben. Schlie\u00dflich hat Facebook Berechtigungen komplett gestrichen: Eine App kann seither nicht erfassen, wer die Kontakte einer Person auf Facebook sind, wenn diese die App nicht ebenfalls nutzen. Datenskandale wie jener von Cambridge Analytica sind daher bereits seit Jahren nicht mehr m\u00f6glich.<\/p>\n<p><strong>Schutz der Pers\u00f6nlichkeitsrechte oder \u00f6ffentliches Interesse?<\/strong><\/p>\n<p>Facebook engt schrittweise ein, welche Daten Apps aber auch Journalisten oder Wissenschaftler erfassen k\u00f6nnen. Im Fr\u00fchjahr 2018 kam es zu einem weiteren radikalen Einschnitt. Alle \u00f6ffentlichen Informationen einer Page lie\u00dfen sich bis dahin erfassen \u2013 dazu z\u00e4hlten auch die Kommentare, die User \u00f6ffentlich auf der Seite erfassten. Mit solchen Daten konnte man zum Beispiel auswerten, ob eine gro\u00dfe Zahl von Usern besonders aktiv ist auf einer Seite oder ob eine Minderheit die Mehrzahl aller Postings verfasst. Genau diese Information l\u00e4sst sich seit Fr\u00fchjahr 2018 <a href=\"https:\/\/newsroom.fb.com\/news\/2018\/04\/restricting-data-access\/\" target=\"_blank\" rel=\"noopener\">nicht mehr sammeln<\/a> und auswerten \u2013 auch wenn es sich hier um \u00f6ffentlich sichtbare Kommentare handelt. Jede Userin und jeder User kann auf jede Page gehen und sich anschauen, wer was ver\u00f6ffentlicht oder kommentiert hat. \u00dcber die Programmierschnittstelle (API) ist dies jedoch nicht mehr m\u00f6glich. Die Kommentare selbst k\u00f6nnen ausgelesen werden, wer die Kommentare ver\u00f6ffentlicht hat, nicht. Deshalb ist eine Analyse, wer wie viele Kommentare und auf welchen Pages ver\u00f6ffentlicht hat, wie wir sie durchgef\u00fchrt haben, in Zukunft nicht mehr m\u00f6glich. Facebook engt hier das Blickfeld ein: Es werden damit keine privaten Daten gesch\u00fctzt, sondern die Auswertung erschwert, wer sich wie am \u00f6ffentlichen Diskurs beteiligt.<\/p>\n<p>Facebook ergriff auch weitere Schritte: Eine nachvollziehbare H\u00fcrde ist ein umfassender Prozess bis man Zugriff auf die Programmierschnittstelle bekommt. Konnte bisher jede Userin und jeder User \u00f6ffentliche Daten und Daten von Personen, die der App Zugriff gegeben haben, abfragen, ist es in Zukunft nur noch verifizierten Organisationen gestattet. Es muss f\u00fcr jede Art des Datenzugriffs eigens erkl\u00e4rt werden, warum er n\u00f6tig ist und wie er genutzt werden wird. Die Apps werden von Facebook getestet und erst dann freigegeben. Die Organisation muss ihre Echtheit nachweisen.<\/p>\n<p>Twitter hat einen anderen Weg eingeschlagen. Dort wird der Zugriff auf die \u00f6ffentlichen Daten verkauft. Es gibt eine kostenlose API, \u00fcber die Userinnen und User Lese-, Schreib-, und Direktnachrichten-Zugriff geben k\u00f6nnen. Ebenfalls kostenlos ist der Zugriff auf \u00f6ffentliche Tweets der letzten sieben Tage, jedoch ist stark beschr\u00e4nkt, wie schnell die Tweets abgefragt werden k\u00f6nnen. Eine <a href=\"https:\/\/developer.twitter.com\/en\/docs\/tweets\/search\/overview.html\" target=\"_blank\" rel=\"noopener\">Premium-API<\/a> gibt Zugriff auf das gesamte Archiv \u00f6ffentlicher Tweets. Somit sind Auswertungen von Tweets nicht nur einfacher m\u00f6glich, sondern auch zuverl\u00e4ssiger. Eine Folge davon ist, dass es gemessen an der Nutzung \u00fcberproportional viele Untersuchungen mit Twitter-Daten gibt. Einfach gesagt: Dass so viele Studien die Kommunikation auf Twitter messen, liegt wohl auch daran, dass es einfacher ist, Analysen auf Twitter als auf Facebook zu betreiben.<\/p>\n<p><strong>Die Schw\u00e4chen der Facebook-Schnittstelle<\/strong><\/p>\n<p>Das Dilemma f\u00fcr alle Datenauswertungen auf Facebook ist: Es gibt dabei Datenunsicherheiten. Zum Beispiel stellt sich die Frage, wie zuverl\u00e4ssig die Programmierschnittstelle ist. Werden immer die gleichen Daten ausgegeben? Geringe Schwankungen sind zu erwarten, weil sich die Pages selbst ver\u00e4ndern. Selbst wenn man den gleichen Zeitraum abfragt, k\u00f6nnen bei unterschiedlichen Abfragen leicht unterschiedliche Ergebnisse gesammelt werden, weil Userinnen und User sowie Pages zwischendurch Beitr\u00e4ge, Kommentare oder Reactions l\u00f6schen und\/oder Neues hinzukommt. Facebook nutzt nicht einen Server, sondern tausende, die miteinander synchronisiert werden, sodass es passieren kann, dass man von unterschiedlichen Orten leicht unterschiedliche Ergebnisse bekommt, weil man auf unterschiedlichen Servern landet.<\/p>\n<p>Dar\u00fcber hinaus gibt es Bugs, die Inhalte fehlerhaft ausgeben. Seit mindestens 2015 gab es einen oder mehrere Bugs, die verhindert haben, dass alle Beitr\u00e4ge von Pages ausgegeben wurden. Dies gab Facebook <a href=\"https:\/\/developers.facebook.com\/support\/bugs\/1624654314422095\" target=\"_blank\" rel=\"noopener\">im Jahr 2015<\/a> und <a href=\"https:\/\/developers.facebook.com\/support\/bugs\/1838195226492053\/\" target=\"_blank\" rel=\"noopener\">im Jahr 2018<\/a> zu. Obwohl Facebook mehrmals behauptet hat, der Bug wurde gefixt (was m\u00f6glich ist, wenn es unterschiedliche waren), scheint dieses Problem nun nicht mehr von Facebook ausgebessert zu werden: Mittlerweile bezeichnet Facebook dies als eine offizielle Limitierung der Programmierschnittstelle. Dies hat zur Folge: Pages, die in einem Jahr mehr als 600 Beitr\u00e4ge ver\u00f6ffentlichen, werden nicht vollst\u00e4ndig ausgegeben.<\/p>\n<div id=\"attachment_231\" class=\"wp-caption aligncenter ratio-wrap-center\" style=\"width:613px;\"><a href=\"https:\/\/developers.facebook.com\/docs\/graph-api\/reference\/v3.0\/page\/feed\"><div style=\"width: 613px;\" data-width=\"613\" class=\"ratio-wrap\"><div class=\"ratio-box\" style=\"padding-bottom: 37.357259380098% !important;\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-231 lazyload\" alt=\"\" width=\"613\" height=\"229\" data-src=\"https:\/\/www.digitalreport.at\/wp-content\/uploads\/2018\/07\/facebook-screenshot-limitations.png\" data-srcset=\"https:\/\/www.digitalreport.at\/report-facebook\/wp-content\/uploads\/sites\/4\/2018\/07\/facebook-screenshot-limitations.png 816w, https:\/\/www.digitalreport.at\/report-facebook\/wp-content\/uploads\/sites\/4\/2018\/07\/facebook-screenshot-limitations-300x112.png 300w, https:\/\/www.digitalreport.at\/report-facebook\/wp-content\/uploads\/sites\/4\/2018\/07\/facebook-screenshot-limitations-768x287.png 768w, https:\/\/www.digitalreport.at\/report-facebook\/wp-content\/uploads\/sites\/4\/2018\/07\/facebook-screenshot-limitations-600x224.png 600w, https:\/\/www.digitalreport.at\/report-facebook\/wp-content\/uploads\/sites\/4\/2018\/07\/facebook-screenshot-limitations-280x105.png 280w, https:\/\/www.digitalreport.at\/report-facebook\/wp-content\/uploads\/sites\/4\/2018\/07\/facebook-screenshot-limitations-670x250.png 670w\" data-sizes=\"(max-width: 613px) 100vw, 613px\"><\/img><\/div><\/div><\/a><p class=\"wp-caption-text\">Quelle: facebook.com<\/p><\/div>\n<p>F\u00fcr alle Datenauswertungen, die Pages mit hoher Postingfrequenz miterfassen, f\u00fchrt dies zu einem Problem: Man muss davon ausgehen, dass Facebooks eigene Programmierschnittstelle einen kleinen Teil der Beitr\u00e4ge nicht mitausliefert. Im Digitalreport war dies bei der Page von Heinz-Christian Strache der Fall: Diese Facebook-Seite postet deutlich mehr als die anderen Accounts. Facebook sagt, dass es \u00fcber die Programmierschnittstelle maximal 600 Beitr\u00e4ge auswirft. Was es leider nicht verr\u00e4t ist, nach welcher Logik diese Beitr\u00e4ge ausgew\u00e4hlt werden. Wir haben im Laufe eines Monats mehrere Erhebungen gemacht und verglichen, welche Beitr\u00e4ge vorhanden bleiben und welche verschwinden. Zwischen der ersten Erhebung am 11. Juni und der letzten am 2. Juli 2018 sind 72 Beitr\u00e4ge im beobachteten Zeitraum 1.1.2018-1.6.2018 \u201everschwunden\u201c. \u00dcber die Direktlinks sind die Beitr\u00e4ge weiterhin abrufbar; sie wurden also nicht gel\u00f6scht. Es ist kein Muster erkennbar, welche Beitr\u00e4ge nicht mehr abrufbar sind. Es gibt zahlreiche Beitr\u00e4ge mit weniger Interaktionen, die in der letzten Erhebung noch vorhanden sind. Somit werden Auswertungen von Facebook Pages, die viele Beitr\u00e4ge ver\u00f6ffentlichen unverl\u00e4sslicher, je sp\u00e4ter im Jahr sie durchgef\u00fchrt werden. Um m\u00f6glichst sichere und vollst\u00e4ndige Daten erheben zu k\u00f6nnen, haben wir uns dazu entschlossen, eine Kombination aus zwei Datenerhebungen als Grundlage f\u00fcr die Auswertung zu nutzen, da wir in dieser den vollst\u00e4ndigsten \u00dcberblick haben.<\/p>\n<p>Bei Twitter gibt es bei der kostenlosen API ebenfalls eine Datenunsicherheit, die noch nicht ausreichend untersucht wurde. Twitter <a href=\"https:\/\/developer.twitter.com\/en\/docs\/tweets\/search\/overview\/standard\" target=\"_blank\" rel=\"noopener\">spricht<\/a> von einem Fokus auf Relevanz statt Vollst\u00e4ndigkeit. Die kostenpflichtige Premium-Version verspricht Vollst\u00e4ndigkeit.<\/p>\n<p>In der Theorie k\u00f6nnte es sehr leicht sein, \u00f6ffentliche Daten \u00fcber Facebooks Schnittstelle auszuwerten: In der Praxis gibt es Einschr\u00e4nkungen, die Auswertungen erschweren (oder im Fall der User-Kommentare) komplett verunm\u00f6glichen. Und es scheint so zu sein, dass Facebook diese \u00f6ffentlich auswertbaren Daten weiter einschr\u00e4nkt. Dies erschwert die Recherche zur Diskussionskultur auf sozialen Medien.<\/p>\n<p><strong>Die Neuerung: Wenige sehen nun vieles<\/strong><\/p>\n<p>Facebook hat schon l\u00e4nger zahlreiche Wissenschaftlerinnen und Wissenschaftler <a href=\"https:\/\/research.fb.com\/\" target=\"_blank\" rel=\"noopener\">angestellt<\/a>, die nicht zur Zugriff auf Daten haben, sondern teilweise signifikant in die Funktionsweise der Plattform eingreifen. Etwa um <a href=\"https:\/\/www.zeit.de\/digital\/internet\/2014-06\/facebook-studie-nutzerdaten-datenschutz\" target=\"_blank\" rel=\"noopener\">herauszufinden<\/a>, wie Userinnen und User auf einen Feed von eher positiven oder eher negativen Meldungen reagieren. Auch Kooperationen mit externen Forscherinnen und Forschern hat es in der Vergangenheit gegeben. Dort hat aber Facebook Einfluss darauf welche Daten wie genutzt und ver\u00f6ffentlicht werden.<\/p>\n<p>Nun wird der Zugriff f\u00fcr einen Teil der Wissenschafts-Community massiv ausgebaut: Am 11. Juli 2018 wurde <a href=\"https:\/\/socialscience.one\/blog\/social-science-one-public-launch\" target=\"_blank\" rel=\"noopener\">Social Science One<\/a> gestartet. Es handelt sich hier um eine Organisation, die explizit nicht zu Facebook geh\u00f6rt und von sieben Non Profit Organisationen finanziert wird. \u00dcber diese soll in Zukunft Forschung von Social-Media-Plattformen m\u00f6glich sein. Der erste Datensatz, der dar\u00fcber verf\u00fcgbar gemacht wird, sind alle URLs, die mindestens 20-mal auf Facebook geteilt wurden. Der Datensatz ist jedoch nicht f\u00fcr alle verf\u00fcgbar, sondern nur f\u00fcr Auserw\u00e4hlte: Wissenschaftlerinnen und Wissenschaftler m\u00fcssen sich daf\u00fcr bewerben. Ein Komitee sucht dann Personen und Gruppen aus, die neben Zugriff auf die Daten auch eine Finanzierung bekommen k\u00f6nnen.<\/p>\n<p>Sie erhalten die Daten jedoch nicht direkt, sondern m\u00fcssen aufgrund von Beispieldaten ein Programm schreiben, das die Daten auswertet. Das Programm wird dann Social Science One \u00fcbergeben, die es auf dem gesamten Datensatz ausf\u00fchren und \u00fcberpr\u00fcfen, ob das Ergebnis lediglich anonymisierte Daten enth\u00e4lt. Wenn dies der Fall ist, werden die angesuchten Daten den Forscherinnen und Forschern gegeben. Facebook hat keinen Einfluss darauf, wer die Daten untersuchen darf oder was ver\u00f6ffentlicht wird. F\u00fcr die Wissenschaft ist das ein umst\u00e4ndlicher, aber nachvollziehbarer Prozess, da eine Weitergabe riesiger Datenmengen auch die Gefahr birgt, dass einzelne Nutzerinnen und Nutzer wieder identifiziert werden k\u00f6nnen. Der nun eingef\u00fchrte Prozess soll erm\u00f6glichen, dass Forscherinnen und Forscher basierend auf gro\u00dfen Datenmengen Auswertungen machen k\u00f6nnen \u2013 aber nicht Zugriff auf alles erhalten. Eine Schattenseite hat dieses System jedoch: Wer kein Mitglied einer Forschungseinrichtung ist, kann sich hierf\u00fcr nicht bewerben \u2013 im neu eingef\u00fchrten Setting k\u00f6nnen auch Redaktionen nicht um Zugriff auf Facebooks Datenschatz ersuchen. W\u00e4hrend die Recherchem\u00f6glichkeiten f\u00fcr einzelne Forscherinnen und Forscher aktuell also erweitert werden, wird der <a href=\"https:\/\/www.wired.com\/story\/social-science-one-facebook-fake-news\/\" target=\"_blank\" rel=\"noopener\">Einblick<\/a> f\u00fcr alle anderen interessierte Gruppen hingegen eingeengt.<\/p>\n<p>\u00a0<\/p>\n<p><em>Die Methodik dieser Analyse erkl\u00e4rt Luca Hammer auch <a href=\"https:\/\/www.digitalreport.at\/wie-wurden-die-daten-gesammelt-ein-paar-fragen-an-luca-hammer\/\" target=\"_blank\" rel=\"noopener\">hier<\/a>.<\/em><\/p>","protected":false},"excerpt":{"rendered":"<p>Wie einfach und doch schwierig das Erstellen von Datenanalysen ist, erkl\u00e4rt Luca Hammer. Denn zunehmend l\u00e4sst sich beobachten, dass Facebook den Zugriff <span><a class=\"read-more\" href=\"https:\/\/www.digitalreport.at\/report-facebook\/2018\/02\/13\/datenanalyse-im-zeitalter-sozialer-netzwerke\/\">Read More<\/a><\/span><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","twitterCardType":"","cardImageID":0,"cardImage":"","cardTitle":"","cardDesc":"","cardImageAlt":"","cardPlayer":"","cardPlayerWidth":0,"cardPlayerHeight":0,"cardPlayerStream":"","cardPlayerCodec":""},"categories":[4],"tags":[],"_links":{"self":[{"href":"https:\/\/www.digitalreport.at\/report-facebook\/wp-json\/wp\/v2\/posts\/230"}],"collection":[{"href":"https:\/\/www.digitalreport.at\/report-facebook\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.digitalreport.at\/report-facebook\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.digitalreport.at\/report-facebook\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.digitalreport.at\/report-facebook\/wp-json\/wp\/v2\/comments?post=230"}],"version-history":[{"count":0,"href":"https:\/\/www.digitalreport.at\/report-facebook\/wp-json\/wp\/v2\/posts\/230\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.digitalreport.at\/report-facebook\/wp-json\/wp\/v2\/media?parent=230"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.digitalreport.at\/report-facebook\/wp-json\/wp\/v2\/categories?post=230"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.digitalreport.at\/report-facebook\/wp-json\/wp\/v2\/tags?post=230"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}