Archiv der Kategorie: Textkorpus

Textkorpus

Ein Textkorpus der AfD-Fraktion Sachsen

Tagwolke aus den 250 am häufigsten benutzen Wörtern

Tagwolke aus den 250 am häufigsten benutzen Wörtern

Seit ihrem Einzug in den sächsischen Landtag 2014, welcher gleichzeitig das erste Landesparlament in Deutschland war, in das die AfD einzog, hat die sächsische AfD-Fraktion viele tausend [ZIP-Datei, ~23 MB] Pressemitteilungen geschrieben und verbreitet. Teilweise im Akkord werden täglich mehrere solcher Erklärungen veröffentlicht.

Der hier einseh- und herunterladbare Textkorpus [ZIP-Datei, 212 KB] hat nun alle 2933 Pressemitteilungen, die vom November 2014 bis zum 23.4.2018 veröffentlicht wurden, als Textgrundlage verarbeitet. Herausgekommen ist eine Tabelle, in der die Verwendung von Wörtern nach ihrer Häufigkeit einsehbar ist. Rangliste inklusive. Für ein Gefühl der besseren Übersichtlichkeit, wurden die häufigsten Deutschen Wörter (als Stop-Words) aus dem Korpus entfernt. Die Stop-Words [TXT-Datei, 2 KB] sind ebenfalls hier einseh- und herunterladbar. Ausgehend von dieser Tabelle lassen sich graphische Übersichten oder einfach nur Diagramme erstellen, die inhaltliche Gewichtungen der AfD-Fraktion Sachsen sichtbarer machen. Nebenher gibt es darauf aufbauend eine Suchmaschine, in der man mit Platzhaltern/Wildcards nach Wörtern suchen kann, was die Arbeit oder Übersichtlichkeit mitunter erleichtert. Die Suchmaschine greift allerdings, technisch bedingt, nur auf 4785 Wörter  [ZIP-Datei, 34 KB] insgesamt zurück, oder anders gesagt, auf alle Wörter mit einer minimalen Häufigigkeit von 20. Was der Erfassbarkeit aber zuträglich ist. Die Credits für das dazugehörige Python-Script, welches die HTML-Dateien verarbeitet, gehen übrigens umfänglich an „Kamikaze„.

A propos Rangliste. Auf Platz 1 findet sich mit weitem Abstand als „Sieger“ das Wort CDU.

6211 mal findet sich das Akronym in den 2933 Pressemitteilungen wieder. Klar, die CDU ist für die AfD der unmittelbarste Gegner, auch wenn man gelegentlich einen anderen Eindruck erhalten kann.

Auf Platz zwei findet sich dann der sächsische Juniorpartner der CDU, also die SPD. Mit 3303 Nennungen aber schon mit mehr als deutlich Abstand.

Erwähnt sei im Vorspann noch Platz 4, der Asylbewerber heißt. 2833 mal findet sich dieses exakte Wort. Nimmt man alle Variationen, von asyl ausgehend, zusammen, ergibt sich mit insgesamt 7029 der offenbar eigentliche „Sieger“.

Ein paar tiefere Einblicke

Die 50 häufigsten Wörter

Die 50 häufigsten Wörter

Der Blick in die häufigsten Wörter zeigt schon, welche Themen und Inhalte die AfD gerne bearbeitet, gerne auch gremienübergreifend (Kommunal, Land, Bund, EU).

Doch woher nimmt die AfD-Fraktion Sachsen eigentlich ihre Themen? Hier lohnt dann ein genauerer Blick, denn wenngleich in den eigentlichen Texten wie üblich von Lücken- oder gar Lügenpresse die Rede ist, bedient man sich derer offenbar und nur zu gern als Quellen.

Tagwolke aus den 250 am häufigsten genannten Wörtern

Tagwolke aus den 250 am häufigsten genannten Wörtern

Der MDR beispielsweise, taucht 399 mal im Textkorpus und ist immerhin auf Platz 115 und damit das meist genannte Medium. Dabei wird er nicht jedes mal als Staatsfunk bezeichnet, denn dieses Wort ist nur 68 mal zu finden, auf einem „mittleren“ 1420. Platz. Staatsfernsehen ist mit 32 Erwähnungen auf Platz 3081 zu finden und GEZ 78 mal, an Stelle 1187.

Aber auch ARD und ZDF sind mit 235 respektive 146 Erwähnungen häufig zitiert.

Aufgrund der (zusammengesetzten) Schreibweise der Namen von Zeitungen ist zum besseren Vergleich, folgendes direkt im HTML-Bestand der Pressemitteilungen gesucht worden, weswegen kein Stelle im Rang genannt werden kann.

Bei Tageszeitungen ist die Freie Presse führend, mit 200 Funden, die Leipziger Volkszeitung nur 53 mal, die Dresdner Morgenpost 183 mal, die BILD-Zeitung allgemein 138 mal und die sächsische Zeitung aus Dresden 180 mal. Die rechte Wochenzeitung Junge Freiheit taucht so 77 mal auf.

Es zeigt sich bei der inhaltlichen Lektüre der Meldungen, dass all diese Medien dabei mehr als nur Stichwortgeber sind. Mitunter bezieht sich die AfD in ihren Meldungen auf Vorgänge im Landtag, die aber als „Neuigkeit“ aus der Presse ausgegeben werden, obwohl sie als Oppositionspartei im Landtag dafür keine Information aus der Zeitung bräuchte. Aber auch über die parlamentarische Ebene hinaus, sind Zeitungsberichte willkommener Anlass ein Thema zu besetzen. So „kommentieren“ die Abgeordneten der AfD recht fleißig, immerhin 184 mal, obschon der Kommentar ja eher ein journalistisches Stilmittel ist und kein politisches.

Die Liebe zur Presse geht allerdings noch weiter. Immer wieder finden sich in den Pressemitteilungen der AfD nicht nur übernommene Sätze aus Zeitungs- oder Agenturmeldungen, sondern teilweise auch einfach komplett abgeschriebene, vulgo geklaute, Artikel, die dann als Kommentar oder Stellungnahme eines Abgeordneten gelabelt werden.

Eine weitere Auffälligkeit ist, dass die AfD-Fraktion im sächsischen Landtag, oft ignoriert, dass sie eben im sächsischen Landtag „tätig“ ist. So werden auch kommunale Vorgänge kommentiert, sogar in anderen Bundesländern oder gar gleich außerhalb Deutschlands. Der Klassiker ist aber Europa.

Der Euro, die EU oder Europa sind insgesamt 4128 mal zu finden, belegen so Platz 6, 9 und 129.

Auch der Bundestag und Berlin wurde vom sächsischen Landesparlament aus 232 bzw. 316 mal erwähnt. Die Bundesregierung an sich 849 mal, was sogar Platz 42 ergibt.

Ebenso taucht jedes deutsche Bundesland in einem zweistelligen Bereich auf, mit Ausnahme des Saarlandes, welches keine Erwähnung findet.

Aber auch international wird viel geschrieben, Russland taucht 813 mal auf und ist damit auf Platz 43 in der Rangliste. Zum Vergleich, die USA bringt es auf 88 Erwähnungen, was Platz 1017 ergibt.

Die sächsische Staatsregierung schafft es übrigens in die „Top 10“ mit 1776 Erwähnungen auf Platz 8.

Ein Feld, welches sich für eine quantitative Analyse geradezu anbietet, ist: „Extremismus“.

Immer wieder beteuert die AfD, dass sie als demokratische Partei „der Mitte“, sich selbstverständlich gegen jede Spielart des politischen Extremismus im Sinne des Verfassungsschutzes (Links-, Rechts-, ausländischer und religiöser Extremismus) ausspricht.

Allerdings, rein von den Wortmeldungen her, kann man das kaum so stehen lassen.

Sucht man im Textkorpus nach Rechtsex*, erhält man drei Ergebnisse, die insgesamt 184 Erwähnungen ergeben, keines davon ist auf einem Platz unter der 1000. Ganz anders bei der Suche nach Linksex*: 1660 Treffer erhält man da, die Top-Nennung Linksextremisten bringt es mit 661 Ergebnissen allein auf Platz 54. 448 Treffer werden für Islamist* ausgegeben.

Links- und Rechtsextremismus

Links- und Rechtsextremismus

Noch deutlich wird das Feld, sucht man direkt in den Überschriften der Pressemitteilungen nach diesen Wörtern.

So findet man bei der Suche nach Rechtsex* zwar 5 Pressemitteilungen, deren Überschriften machen aber schon deutlich, dass die Intention der Texte eigentlich einen anderen Phänomenbereich meint:

1) afd-fraktion-gruendet-verein-der-links-und-rechtsextremismus-beobachtet.html

2) innenministerium-empfiehlt-islamisten-und-salafisten-aussteigerprogramm-fuer-rechtsextremisten.html

3) linksextremisten-in-sachsen-deutlich-gewalttaetiger-als-rechtsextremisten.html

4) rechtsextremismus-in-kitas-nur-laerm-um-nichts.html

5) studie-der-uni-leipzig-rechtsextremisten-waehlen-am-liebsten-spd.html

Auch auf diese Weise, ist der „Islamismus“ ein größeres Themenfeld, mit 33 Erwähnungen in Überschriften. Linksextremismus ist aber auch hier das dominierende Thema, allein 76 Pressemitteilungen (nach Überschriften) machen diesen deutlich.

Abgesehen von den Namen der Abgeordneten, die diese Pressemitteilungen (scheinbar) verfassen, finden sich natürlich viele weitere Politiker im Textkorpus. So ist der ehemalige Ministerpräsident Sachsens, Stanislav Tillich, 1054 mal erwähnt und damit auf Platz 28. Auch sein Nachfolger, Kretschmer, ist schon mit 311 Erwähnungen bedacht, immerhin Platz 154. An Landespolitikern ist der ehemalige Innenminister Ulbig zu nennen, nämlich über 952 mal, Sachsens Wirtschaftsminister Dulig mit 763 Nennungen. Der Justizminister Gemkow ist selten zu lesen, nur 73 mal, die Integrationsministerin Köpping, wenig überraschend, trotz kleinem Ressort deutlich öfter: 224 mal.

Namens-Tagwolke

Namens-Tagwolke

Allerdings, es führt wieder mal eine völlig andere Ebene, nämlich die des Bundestags. Die Bundeskanzlerin Angela Merkel ist mit 1104 Nennungen auf Platz 24 und damit noch vor dem sächsischen Ministerpräsidenten. Ein weiterer Bundespolitiker schafft es in die „Top 100“, den ehemaligen Justizminister Maas, heutiger Außenminister kommt mit 512 Erwähnungen auf Platz 79.

Allgemein ist die so sichtbar gewordene Gewichtung von Themen einen tieferen Blick wert.

Beispielhaft sei hier nur folgendes genannt: Die Bundeswehr schafft es bei der AfD-Fraktion Sachsen 350 Mal genannt zu werden, was einem recht guten Platz 142 entspricht. Auch das Wort Armee findet sich 97 mal. Sucht man hingegen nach Hartz (IV), immerhin dem vermutlich brisantesten „Sozialthema“, kommt man auf Platz 646 mit 125 Nennungen. Aber auch die Platzhalter-Suche nach sozial* findet kaum mehr Erwähnungen: „sozialen“ 187 mal und sozial 126 mal.