Loading...

Wie durchleuchtet man YouTube? Das erklärt Datenspezialist Josef Holnburger

Diesmal analysiert der Digitalreport die österreichische YouTube-Szene. Ist das Datensammeln auf YouTube einfacher als auf Facebook?

Josef Holnburger Tatsächlich geht Google – welches ja YouTube besitzt – etwas offener mit den Daten um. Auch hier ist es möglich, über eine Programmierschnittstelle (eine „API“) auf öffentliche Daten zuzugreifen. Dabei können Infos wie Videoaufrufe, Bewertungen von Videos und Kommentare abgerufen werden.

Kann man so alle Diskussionen auf YouTube herunterladen?

J.H. Nein. Google begrenzt die Anzahl der Downloads durch ein Credit-System. Alle 24 Stunden können Informationen für eine Millionen Credits „erworben“ werden – dabei wird der Wert einer Information aber unterschiedlich gewichtet: Eine Suche kostet 100, die Statistiken eines Kanals abzurufen kostet drei Credits.

Und darüber konntet ihr herausfinden, welche YouTuber in Österreich besonders beliebt sind?

J.H. Leider nein: YouTube ermöglicht nicht, automatisch nach Accounts aus einem konkreten Land zu suchen. Wir mussten hierfür etliche Quellen anzapfen: Webseiten wie Kanalfinder.de oder Socialblade listen einige österreichische Kanäle. Auch die Medienbehörde RTR gab schon mal eine Studie über die „Top 100“-Kanäle in Auftrag. Wir haben all diese Infos zusammengetragen und auch analysiert, ob uns über die User-Kommentare weitere reichweitenstarke Accounts aus Österreich auffallen. Insgesamt haben Kollege Luca Hammer und ich 4 Millionen Kanäle überprüft und jene gesammelt, die als Ort Österreich angeben. In den „Top 1000“ finden sich die Kanäle mit den meisten Abonnenten.

Kann sein, dass irgendein österreichischer Kanal doch nicht in eurer Liste der Top-1000-Kanäle enthalten ist?

J.H. Natürlich – wir haben versucht, möglichst jeden österreichischen Account zu erfassen. Aber da YouTube keine komplette Liste einsehen lässt, kann es immer Lücken geben. Wir haben zumindest die bisher vollständigste YouTube-Liste zu Österreich erstellt.

Kann man die Ergebnisse des Digitalreports reproduzieren?

L.H. Ja, auch diesmal kann jeder das Script zur Datenerhebung frei nutzbar herunterladen. Es wurde in der Programmiersprache R geschrieben und findet sich unter github.com/Digitalreport

 

Zur Person: Josef Holnburger ist Datenanalyst und derzeit im Politologie-Masterstudium der Universität Hamburg.

Seine Datenanalysen behandeln Themen wie Verschwörungstheoretiker und Extremismus online

Ergänzende Infos: Die Daten wurden über die Programmierschnittstelle (API) von Google erhoben. Die Auswertung wurde in der Programmiersprache R vorgenommen, die Netzwerkanalysen mit Gephi realisiert. Insgesamt wurden 121.971 Videos und 17,7 Millionen Kommentare von 4,8 Millionen Nutzern untersucht. Erfasst wurden Videos, die zwischen 1. 1. 2015 und 30. 6. 2018 verbreitet wurden.

Die Sprache wurde automatisiert über den Algorithmus CLD2 erfasst und uneindeutige Fälle wurden auch noch manuell durchgegangen

Illustration: Anna Hazod

No Comments

    Leave a Reply