Donnerstag, 25. Mai 2017

Rechtsextremismus im Netz erkennen

Hate Speech, Fake News und rechte Hetze – wer sich Diskussionen in sozialen Netzwerken oder Kommentarspalten anschaut, stößt schnell auf fragwürdige Posts. Längst haben rechte Extremisten das Web 2.0 als Instrument für ihre Propaganda entdeckt. Social Media hilft ihnen, sich zu vernetzen und neue Anhänger zu rekrutieren.

Für unsere Kooperationspartner und Auftraggeber vom Kompetenzzentrum Rechtsextremismus (KomRex) der Uni Jena sind soziale Netzwerke deshalb ein interessantes Forschungsfeld.
Sie untersuchen, wie sich die rechte Szene in Thüringen entwickelt: Wie kommt es dazu, dass sich Menschen radikalisieren? Welche Akteure sind besonders präsent? Und welche Kommunikationsstrategien setzen sie ein? Besonders ergiebig ist dabei Twitter. Alle Tweets sind standardmäßig öffentlich, und weil das Netzwerk kaum moderiert wird, ist es bei Rechten für die Rekrutierung besonders populär.

Anfangs haben Franziska Schmidtke und Lars Vogel vom KomRex hunderte Twitter-Profile per Hand nach rechtsextremen Äußerungen durchsucht. „Wir sind dabei von Accounts wie @npdthueringen ausgegangen und haben uns deren Follower näher angeguckt“, erzählt Franziska. „Wir sind so tatsächlich auf rechtsextreme Nutzer gestoßen, aber die Suche und Auswertung hat enorm lange gedauert. Und weil ja ständig neue Tweets hinzukommen, war es fast unmöglich, auf dem aktuellen Stand zu bleiben.“

Technische Hilfe für die Wissenschaftler


Seit Dezember 2016 arbeiten wir von Semalytix mit dem KomRex zusammen. Wir haben eine Software geschrieben, die den Forschern die Arbeit substanziell erleichtert: Unser Programm durchsucht die Profile automatisch und bewertet anhand verschiedener Merkmale, ob ein Nutzer potenziell rechtsextrem ist oder nicht. Die Kollegen vom KomRex können sich dann gezielt die Profile anschauen, die von unserem Algorithmus vorselektiert wurden.

Um den Computer zu trainieren, haben wir Methoden des Maschinellen Lernens eingesetzt. Als Grundlage hat uns das KomRex einzelne Accounts genannt, die eindeutig rechtsextrem sind, sowie weitere, die eindeutig nicht rechtsextrem sind. Wichtig war, dass alle einen regionalen Bezug zu Thüringen haben – schließlich geht es in dem Forschungsprojekt speziell um Rechtsextremismus in diesem Bundesland. Diese Musterprofile haben wir dem Computer als Lernmaterial gegeben.

Computer im Training


Das Programm hat zunächst sämtliche Tweets der jeweiligen Nutzer durchforstet und untersucht: Was ist typisch für Rechtsextremisten? Wie unterscheidet sich ihr Sprachgebrauch von dem anderer Twitterer? Welche Hashtags nutzen sie, wen retweeten sie und auf welche anderen Nutzer verweisen sie in ihren Tweets? Zusätzlich haben wir einen Emotionsklassifikator aus unserer Semalytix-Pipeline eingesetzt. So konnte der Computer eine Menge typischer Merkmale herausfinden und dann auf neue Profile anwenden.

Genau wie Franziska und Lars es vorher manuell gemacht haben, haben wir auch den Computer die Follower der zuvor untersuchten Accounts analysieren lassen. Und die Follower der Follower – insgesamt mehr als zwei Millionen Profile. Ohne technische Hilfe wäre das nicht möglich gewesen. Aber abgesehen davon, dass die Leute vom KomRex jetzt viel einfacher herausfinden können, welche Twitter-Nutzer sie sich mal genauer anschauen sollten, liefert das Programm auch schon selbst spannende Erkenntnisse über die Kommunikation von Rechtsextremen.

Was ist denn nun typisch für Rechtsextreme?


Zu den „Lieblingswörtern“ der Rechten zählen beispielsweise „Deutsche“, „Asylanten“, „Heuchlerin“ und „Heldengedenken“. Auch der Landkreis Hildburghausen wird häufig erwähnt – er gilt als rechte Hochburg in Thüringen und war 2016 Veranstaltungsort eines Neonazi-Festivals. Außerdem sind die Tweets häufig sehr emotional: Im Durchschnitt drückt ungefähr jeder dritte Tweet eines Rechtsextremen eine starke Emotion aus, vor allem Wut und Abscheu. Generell liegt einer der markantesten Unterschiede zwischen Rechtsextremen und demokratischen Vertretern in der Grundtonalität ihrer Beiträge: Beispielsweise lautet einer der häufigsten Hashtags der Follower von SPD, CDU, Grünen, Linken und Co. #mitredeneu, bei den Rechten ist es #wehrdich.

Was wir bisher noch nicht auswerten können, sind Fotos und Memes. Wir arbeiten aber gerade daran, den Computer auch dafür fit zu machen. Außerdem wollen wir unser Programm noch verfeinern und unter anderem ein Ranking einbauen. Schließlich gibt es Abstufungen zwischen „überzeugter Neonazi“ und „überzeugter Demokrat“, die wir mit unserer bisherigen Klassifikation nicht abbilden können. Ein weiteres großes Projekt: Ironie und Sarkasmus. Das zu erkennen, ist für Computer gar nicht so einfach, aber wir haben schon einige spannende Fortschritte gemacht. Dazu demnächst mal mehr.

http://www.semalytix.de/ 
http://www.komrex.uni-jena.de