5 Fragen an Luca Hammer: Von Trollen und Datenvisualisierungen

Durch Datenvisualisierungen lassen sich komplexe Zusammenhänge erkennbar machen. Einer, der dies immer wieder mit visuell beeindruckenden Netzwerk-Analysen tut, ist Luca Hammer. Auf der diesjährigen re:publica hat Luca in der Session „Mit den Trollen ums Datenfeuer tanzen“ seine Netzwerkanalysen unterschiedlicher Troll-Gruppen auf Twitter vorgestellt und Ideen gegeben, wie man damit umgehen kann. Wir haben mit ihm über die Session und seine Datenvisualisierungen gesprochen.

Hallo Luca, auf der re:publica 2017 hast Du über Deine Analysen zu verschiedenen Troll-Gruppen auf Twitter gesprochen. Was ist das Ergebnis Deiner Analysen?

Luca Hammer (Foto von Tony Gigov)

Es handelt sich um etwa 1000 Accounts, die wiederum in drei Sub-Communities zerteilt sind. An den einzelnen Aktionen nehmen meist 200-300 Accounts teil. Es gibt keine Drahtzieher im Hintergrund, sondern es ist eine gut vernetzte Community. Die Aktionen erinnern an Shitstorms. Ein_e User_in macht auf etwas aufmerksam und die anderen machen mit. Die Gruppe selbst existiert jedoch nicht nur für die Aktionen, sondern es wird ständig über Alltag und Gesellschaft gepostet. Ein großer Unterschied zu anderen Communities auf Twitter ist die Sprache, die eher an anonyme Imageboards (z. B. 8chan, krautchan) erinnert. Man beleidigt sich ständig gegenseitig und freut sich darüber, wenn diese Sprache andere User_innen ausflippen lässt. Insgesamt sind die Accounts politisch eher links, wobei es auch rechte gibt. Redefreiheit ist ein zentrales Motiv.

Wie gehst Du bei Deinen Twitter-Analysen vor? Gibt es Tools, die Dir dabei helfen? Und wieviel Zeit ist für die manuelle Bearbeitung angefallen?

Meine Visualisierungen beschränken sich in den meisten Fällen auf die Strukturen der Netzwerke. Ich sehe mir weniger die Aktivität, sondern die Beziehungen zwischen den Accounts an. Netzwerke basierend auf Retweets und Mentions vernachlässigen meist, wie die Aktivität zustande kommt. Bei einem Retweet besteht oft keine Beziehung zu dem Account, sondern nur zu dem jeweiligen Retweet. Durch Retweets wandern Tweets quer durch alle möglichen Communities und teilweise über lange Zeiträume. Ähnlich bei Mentions, wenn auch nicht so problematisch. Menschen antworten auf Tweets, nicht auf einen Account. Eine Antwort auf einen Retweet erzeugt eine Verbindung, die unter Umständen gar nicht existiert. Besser wäre es dort, bipartite Graphen zu nutzen, also zwei Arten von Knoten zu haben. Einmal die Accounts und einmal die Tweets. Das wird aber schnell unübersichtlich.

Ich arbeite meist in vier Schritten.

Die Auswahl der Accounts, deren Netzwerk ich visualisieren möchte. Möchte ich die Follower oder Followings eines Accounts betrachten? Oder die Accounts, die etwas zu einem bestimmten Hashtag getwittert haben?
Daten sammeln. Tweets. Infos zu den enthaltenen Accounts und Verbindungen zwischen ihnen. Bei Twitter nutze ich dafür das Python-Skript twecoll von Jean-Paul de Vooght, welches ich inzwischen mitentwickle. Ich habe dazu eine ausführliche Anleitung veröffentlicht.
Daten aufbereiten und visualisieren. Die meiste Zeit verbringe ich in Gephi. Auch hierfür habe ich einen Guide geschrieben. Manchmal schreibe ich kleine Skripte oder arbeite mit Excel, um die Daten weiter anzureichern oder zu verändern.
Teilen. Der Großteil der Visualisierungen landet als Screenshot auf meinem Twitter-Account. Ich mache einen Screenshot vom gerenderten Graphen, schreibe Eckdaten und Labels hinein und veröffentliche das Ganze. Bei Auftragsarbeiten kommt am Ende meist ein Bericht als PDF sowie ein Ordner mit Daten und unterschiedlichen Visualisierungen heraus. Dann erstelle ich meist weitere Grafiken mit Excel. Manchmal erstelle ich auch einen Blogpost, etwa bei der Analyse aller verifizierten Twitter-Accounts. Hin und wieder ist das Ergebnis auch interaktiv als Website, wo es selbst erforscht werden kann.

Kleine Visualisierungen schaffe ich inzwischen in etwa einer Stunde. In den meisten Fällen dauert es aber einen Tag bis eine Woche.

Wie war das Feedback auf Deine Untersuchungen und auf Deinen Vortrag?

Der Vortrag ist gut angekommen. Es wurde hervorgehoben, dass ich das Thema neutral behandelt habe. Auch wenn ich eine Meinung dazu habe und offen zu dieser stehe, habe ich versucht die unterschiedlichen Seiten zu betrachten. Auf YouTube hat nur Gunter Duecks Video mehr Views (von den #rp17 Videos). Ich gehe aber davon aus, dass sich das noch ändern wird, je mehr Videos veröffentlicht werden. Viele Views kommen durch die Aufmerksamkeit der beobachteten Gruppen auf Twitter. Das lässt schnell nach bzw. ist schon vorbei.

Die Süddeutsche hat einen längeren Artikel veröffentlicht, bei der FAZ und einigen anderen Medien wurde der Talk erwähnt. Direkt auf der re:publica gab es noch einen Livestream mit Vice Motherboard.

Es gab berechtigte Kritik von unterschiedlichen Seiten. Etwa die Verharmlosung des Themas allgemein oder abwertende Ausdrücke, die ich für bestimmte Accounts verwendet habe.

Für mich ist das Thema erstmal erledigt.

Während die Nutzung solcher Analysen im politischen Kontext ja naheliegt, stellt sich auch die Frage: Wofür könnte man diese Analysen noch nutzen? Könnte man dies z.B. auch für vorbereitende Analysen im Bereich Influencer nutzen?

Netzwerkanalysen sind etwas robuster, wenn es darum geht, Accounts mit mehr Einfluss zu identifizieren. Ich ignoriere Followerzahlen in den meisten Fällen komplett und schaue stattdessen auf die eingehenden Verbindungen der Accounts, also wie viele Personen in diesem spezifischen Netzwerk einer Person folgen. Damit kann ich eine bessere Aussage über die Relevanz des Accounts machen, als wenn ich mir lediglich Follower- oder Interaktionszahlen ansehe. Einen Schritt weiter kann ich das über Centrality-Berechnungen (etwa Eigenvector) noch verfeinern und so Accounts identifizieren, die zwar keine riesige Reichweite haben, aber von Accounts mit großer Reichweite gefolgt werden.

Ich schreibe gerade an einem Artikel für freshvanroot.com, wo ich anhand der Tweets zur re:publica zeige, wie man einflussreiche Accounts identifizieren kann.

Auch hilft es bei der Identifikation von Bots. Gerade wenn diese gut programmiert wurden und rein über Aktivität und Verbindungen unauffällig sind. Aktuell arbeite ich an einem Projekt, in dem ich Blocklisten analysiere. Dort bin ich das erste Mal über ein tatsächliches Bot-Netzwerk gestolpert. In der Praxis sehe ich diese wesentlich seltener, als ich von der Diskussion her das Gefühl habe.

Am Ende ist es immer wichtig, dass man sich nicht auf die Visualisierung verlässt. Es muss immer gegengeprüft werden, ob es auch zur Beobachtung passt.

Du stellst ja regelmäßig neue Datenvisualisierungen und Untersuchungen vor (wie z.B. die Linkanalyse für Twitter-Accounts). Was hast Du als nächstes auf dem Zettel?

Wenn ich Zeit finde, möchte ich das Accountanalysetool weiter ausbauen, etwa indem ich mich von den Features von TweetStats inspirieren lasse, das leider nicht mehr weiterentwickelt wird. Irgendwann soll man damit sein Netzwerk selbst visualisieren können. Bis dahin kann man dafür SocioViz nutzen.

Für Vorschläge bin ich meist offen, auch ich nur wenige Dinge tatsächlich umsetzen kann.

Vielen Dank für das Interview, Luca! Und wer möchte, kann Dir für Deine Analysen und Datenvisualisierungen API-Calls spenden.

Die Session „Mit den Trollen ums Datenfeuer tanzen“ gibt es auf YouTube zum Nachschauen:

Luca Hammer ist in den Alpen aufgewachsen, hat Publizistik- und Kommunikationswissenschaft in Wien und Medienwissenschaften in Paderborn studiert. Er erstellt Netzwerkvisualisierungen (Twitter, Facebook, Blog) und betreut WordPress-Websites.

MonitoringMatcher

Das Magazin rund um digitales Monitoring – Social Media Analytics, Social Media Monitoring, Publishing, Engagement und Web Analytics (sowie Anbieter-Listen, Lese-Tipps und Termine).
Hier schreiben vor allem Stefan Evertz und Katja Evertz – Gastautoren sind aber sehr willkommen (siehe auch Mission).