Die Digitalisierung der Welt bietet auch Wissenschaftlern ungeahnte Möglichkeiten. Auf einmal werden Datenbestände verfügbar, die nicht einmal in jahrelanger Fleißarbeit von Forschern hätten durchforstet werden können. Ein solches Projekt haben jetzt Wissenschaftler der Kazan Federal University in Russland und des Max-Planck-Instituts für evolutionäre Anthropologie in Leipzig durchgeführt. Sie nutzten die faszinierenden Möglichkeiten von "Google Books Ngram Korpus".

“Google Books” ist das gewaltige Scan-Programm des Suchmaschinenbetreibers Google, mit dem der Konzern im Grunde vor hat, den Buchbestand der Menschheit komplett zu digitalisieren und in einer Datenbank verfügbar zu machen. Bis 2015 sollen so allein 15 Millionen Bücher gescannt werden. Seit über zehn Jahren halten aber auch die Streitigkeiten um Urheberrechte an, denn wenn Google auch Bücher der Gegenwart und noch lebender Autoren einscannt und so veröffentlicht, greift der Konzern natürlich direkt in die Rechte von Autoren, Verlagen und anderen Rechteinhabern ein.

Für Wissenschaftler ist das Projekt aber schlichtweg faszinierend. Teilweise werden so Buchbestände weltweit verfügbar, die sonst nur noch in wenigen Exemplaren in wenigen Bibliotheken zu finden sind – ein Riesenberg an Material für Forscher, die so leichteren Zugang zu wichtigen Quellen haben. Seit einigen Jahren gibt es auch ein Programm, das diese riesige Datenbank aufspaltet in ihre einzelnen Wortbestandteile, abgekürzt: N-Grams.

Und genau dieses Programm hat nun auch die Forscher aus Leipzig und Kazan in ihren Bann geschlagen, denn damit kann man dem Gedruckten der letzten 500 Jahre mit neuen Analysemethoden zu Leibe rücken, kann den gewaltigen Textbestand in verschiedensten Sprachen lexikalisch, kulturgeschichtlich oder nach dutzenden anderen Filterverfahren durchforsten. Was sichtbar wird, sind auf einmal geschichtliche Entwicklungen, die sich direkt in den Sprachen der Völker niederschlagen.

“Wie häufig wir bestimmte Wörter verwenden, ändert sich ständig”, stellt nun das Max-Planck-Institut für evolutionäre Anthropologie in einer Mitteilung fest. “Neue Wörter erscheinen, andere verschwinden. Doch wie sich die Dynamik dieser Veränderungen in verschiedenen Sprachen gestaltet, ist nur wenig erforscht.”

Die Wissenschaftler haben jetzt die Evolution des englischen Wortschatzes im Vergleich zum russischen, deutschen, französischen, spanischen und italienischen untersucht. Dabei nahmen sie besonders die Rolle großer gesellschaftlicher Ereignisse für die Veränderung von Wortgebrauchen in den Fokus.

Sie stellten fest, dass Kriege und andere gesellschaftliche Veränderungen die Evolution des Wortschatzes beschleunigen können, während sich in Zeiten der Stabilität das Vokabular einer Sprache weniger schnell verändert. Weitere Analysen ergaben, dass sich das britische und das amerikanische Englisch auseinander entwickelten, seit Mitte des 20. Jahrhunderts aber wieder einander annähern. Und das hängt aus ihrer Sicht wohl direkt mit der Entwicklung der Massenmedien zusammen. Abgesehen von diesen Besonderheiten konnten die Forscher aber auch universelle Trends bei der Wortschatzentwicklung feststellen, denn über längere Zeiträume hinweg betrachtet ändert sich das Vokabular verschiedener Sprachen in einem ähnlichen Maße.
Im Wortschatz einer Sprache spiegelt sich die Welt ihrer Sprecher wider. Veränderungen im Wortschatz reflektieren dementsprechend veränderte Umwelt- und Lebensbedingungen. In ihrer aktuellen Studie haben Søren Wichmann vom Max-Planck-Institut für evolutionäre Anthropologie und seine Kooperationspartner von der Kazan Federal University untersucht, wie sich der Wortschatz von Sprachen im Laufe der Zeit verändert. Mithilfe des “Google Books N-Gram Korpus” konnten die Forscher den Gebrauch von Wörtern über fünf Jahrhunderte hinweg verfolgen. Der Google Ngram Viewer untersucht mittels Data Mining, wie häufig in gedruckten Publikationen ausgesuchte Wortfolgen, sogenannte N-Grams, gebraucht werden. Wichmann und seine Kollegen konzentrierten sich bei der Analyse auf einzelne Wörter, so genannte 1-Grams, aus sechs verschiedenen Sprachen und darauf, wie oft diese von Jahr zu Jahr verwendet wurden.

Bei der Auswertung der Daten zeigte sich, dass gravierende Veränderungen in der Verwendungshäufigkeit von Wörtern möglicherweise durch historische Ereignisse, wie zum Beispiel den Ersten und Zweiten Weltkrieg oder die Oktoberrevolution in Russland, ausgelöst wurden.

“Jede gesellschaftliche Umwälzung zieht auch eine veränderte Wortschatzverwendung nach sich”, sagt Wichmann. “Wenn ein Krieg ausbricht oder eine Revolution stattfindet, werden der Sprache neue Wörter hinzugefügt, die die Veränderungen widerspiegeln, denen die Menschen in ihrem Lebensraum ausgesetzt sind.” In Zeiten der Stabilität, wie etwa im Viktorianischen Zeitalter in Großbritannien, blieb auch der Wortschatz relativ konstant.

Weiterhin untersuchten die Forscher die Unterschiede im Wortgebrauch zwischen dem amerikanischen und dem britischen Englisch. Diese beiden Dialekte des Englischen hatten sich seit den 1850er Jahren mehr und mehr auseinander entwickelt, aber seit “Mitte des zwanzigsten Jahrhunderts begannen die beiden Sprachvarianten sich wieder auf einander zuzubewegen, möglicherweise bedingt durch den Einfluss der Massenmedien wie Radio und Fernsehen”, sagt Wichmann. “Interessanterweise hinkt das britische dem amerikanischen Englisch um etwa 20 Jahre hinterher.”

Generell stellten die Wissenschaftler fest, dass die am häufigsten gebrauchten Wörter einer Sprache, wie Artikel, Präpositionen und Konjunktionen, sich über längere Zeit hinweg kaum verändern. Auch der “Kernwortschatz”, der 75 Prozent der geschriebenen Sprache ausmacht, verändert sich weniger häufig. Selten verwendete Wörter verändern sich hingegen häufiger. Wichmann erklärt das so: “Wenn wir einmal herauszoomen und uns einen größeren Zeitraum betrachten, sehen wir, dass sich historisch begründete Veränderungen im Wortschatz der Einzelsprachen aufheben und die Sprachen sich im Prinzip sehr ähnlich verhalten”.
Städte im Zeitverlauf

Und weil so ein Projekt neugierig macht, hat auch die L-IZ einmal ausprobiert, was “Google Books Ngram Korpus” zeigt, wenn man einfach mal die Namen von Städten wie Leipzig, Dresden und Frankfurt eingibt. Denn die Häufigkeit der Nennung in der deutschsprachigen Buchproduktion der vergangenen 200 Jahre sagt natürlich auch etwas aus über die wachsende – und sinkende – Bedeutung von Städten.

Und es überrascht nicht, was dabei herauskommt: Bis ungefähr 1850 verlaufen die Kurven für alle drei Städte recht dicht beieinander. Nur von 1815 bis 1820 und dann wieder zur Zeit des Frankfurter Parlaments 1848 ff. schnellt die Häufigkeitskurve für Frankfurt deutlich nach oben. Ab 1855 löst sich dann aber die Stadt Leipzig deutlich von den anderen Städten und dominiert bis 1960. Die Kurve zeigt recht deutlich den Erfolg der Buch- und Messestadt. Erst ab 1965 wird Leipzig von der aufstrebenden Bank-, Messe- und Börsenstadt Frankfurt überflügelt. Überraschend bleibt trotzdem, dass Leipzig nach dem deutlichen Absturz 1945 bis in die Gegenwart seine Bedeutung auf jeden Fall im Gedruckten behauptet hat. Wenn man die Stadt Hamburg dazu nimmt, liegen Leipzig und Hamburg auch heute noch relativ dicht beieinander. Aber Dresden, von dem man eigentlich annehmen müsste, es wäre zumindest genauso in aller Munde wie Leipzig, hat seine Quote an Nennungen in den letzten 100 Jahren nicht wirklich steigern können.

Ruhm und Verblassen der Philosophen

Dasselbe haben wir auch mal mit den Namen von wichtigen deutschen Philosophen gemacht: Marx, Nietzsche, Hegel und Schopenhauer. Unübersehbar macht sich die staatliche Glorifizierung von Karl Marx in der DDR bemerkbar. Wobei die Kurve auch die starke Rezeption von Marx in der linken Bewegung der alten BRD mit erfasst, die um das Jahr 1968 ihren Gipfelpunkt hatte – seitdem geht die Bedeutung von Karl Marx signifikant zurück. In den letzten Jahren scheint er tatsächlich sogar vom alten Staatsphilosophen Hegel überholt zu werden. Wir haben auch noch Kant und Adorno dazugenommen – und siehe da: Kant, der Bursche mit dem kategorischen Imperativ, scheint heute noch immer so aktuell, wie er es immer war im preußisch fleißigen Deutschland – er hat die Nase vorn.

Leipzigs Autoren im Wechsel der Zeit

Genauso überraschend ist das Spiel mit Leipziger Autorennamen – wobei sich einige Namen wie Meyer, Freytag oder auch May leider verbieten. Dazu sind sie zu landläufig. Aber der kommende 300. Geburtstag von Christian Fürchtegott Gellert 2015 macht zumindest neugierig, ob der Dichter des 18. Jahrhunderts sich heute noch messen kann mit seinem Zeitgenossen Rabener, mit Gottsched oder – zwei berühmten Leipzigern der Neuzeit: Bruno Apitz (der in der DDR mit “Nackt unter Wölfen” Furore machte) oder Erich Loest. Das Ergebnis ist faszinierend, denn Gellerts Ruhm sticht um 1820 noch deutlich hervor – und es ist bis heute nicht vergessen und steckt locker Rabener und Apitz in die Tasche. Erich Loest, dessen Ruhm sich ab 1975 so langsam bemerkbar machte, hat Gellert in den 1990er Jahren überflügelt – aber an den alten Literaturprofessor Gottsched kommt er nicht heran. Zumindest in der Welt der gedruckten Worte.

Mit Material des MPI für Evolutionäre Anthropologie, SJ/HR

www.eva.mpg.de

Der “Google Books Ngram Viewer”: https://books.google.com/ngrams

Wikipedia zu Google Books: http://de.wikipedia.org/wiki/Google_Books

So können Sie die Berichterstattung der Leipziger Zeitung unterstützen:

Ralf Julke über einen freien Förderbetrag senden.
oder

Keine Kommentare bisher

Schreiben Sie einen Kommentar