Quantcast
Channel: Projekte – Digitale Geschichtswissenschaft
Viewing all articles
Browse latest Browse all 17

H-Soz-Kult als Quelle der jüngsten Fachgeschichte. Die Potentiale der digitalen Geschichtswissenschaft am Praxisbeispiel

$
0
0

Der Fachinformationsdienst H-Soz-Kult wurde 1996 als deutscher Ableger der amerikanischen Mailingliste H-Net gegründet und hat sich mit der Zeit als zentrale Kommunikationsplattform der deutschsprachigen Geschichtswissenschaft etabliert[1]. Hier finden sich Informationen zu wissenschaftlichen Veranstaltungen (vom Call for Papers über Konferenzankündigungen bis hin zu den Tagungsberichten), Ankündigungen von Zeitschriftenbänden, Projektbesprechungen, Stellenanzeigen und unzählige Buchrezensionen. Es gibt kein anderes Medium im Fach, dass H-Soz-Kult in Informationsdichte und Reichweite nur irgendwie nahe kommt und es gibt wohl auch keinen Kollegen, der nicht in irgendeiner Art und Weise bereits zu den Veröffentlichungen auf dem Portal beitragen hat, hier erwähnt wurde oder zumindest den Newsletter bezieht.

Fragestellung

Dass H-Soz-Kult heute das zentrales Kommunikationsmittel der deutschsprachigen Geschichtswissenschaft ist, steht außer Frage. Aber, und darum soll es in diesem Beitrag gehen, dieser Umstand macht H-Soz-Kult zugleich zu mehr. Durch seine zentrale Stellung und seine breite inhaltliche Abdeckung ist das Portal zugleich die zentrale Quelle für alle Fragen rund um die Entwicklung der Geschichtswissenschaften in den letzten 20 Jahren. H-Soz-Kult ist damit Informationsdienst und herausragende Quelle der Fachgeschichte zugleich.  

Fragen nach der Digitalisierung des Faches lassen sich hier ebenso stellen wie nach dessen inhaltlicher Entwicklung und seiner Tagungs- und Publikationskultur.  

Dabei gibt es eine Besonderheit: H-Soz-Kult ist ein Internetportal. Daher liegen alle veröffentlichten Texte und Informationen digital vor und lassen sich daher auch mit digitalen Methoden auswerten. Die Veröffentlichungen von H-Soz-Kult sind also zugleich primäre Forschungsdaten.

In meinem Beitrag zu “Forschungsdaten in der (digitalen) Geschichtswissenschaft” habe ich auf die Möglichkeiten hingewiesen, die sich ergeben, wenn wir digitalisierte bzw. genuin digitale Quellen nicht mehr nur mit klassischen hermeneutischen Methoden bearbeiteten und auswerten, sondern auch mit digitalen Methoden. Das heißt, wenn digital vorliegende Quellen nicht mehr nur als historische Quellen, sondern auch als historische Daten verstanden werden. Der folgende Beitrag soll an einem für das Fach zentralem Beispiel zeigen, was damit konkret gemeint ist.

Methodische Vorbehalte

Dabei möchte ich gleich zu Beginn betonen, dass auch digitale Methoden keine Ergebnisse per se liefern. Sie bieten Perspektiven auf das gesammelte Material, die jedoch stets methodisch kritisch zu hinterfragen und historisch zu interpretieren sind. Es ist also nicht so, dass die untenstehenden Diagramme in irgendeiner Form schon historisch gesicherte Evidenzen abbilden. Alles, was sie darstellen, ist eine jeweils neue Form, die Daten zu arrangieren und zu lesen – womit sie zum Anlass für weiterführende inhaltliche und methodische Auseinandersetzung werden können. Denn, und das ist vielleicht das Wichtigste: die hier erzeugten Diagramme sind nicht objektiv.

Sowohl hinsichtlich ihrer Ausgangsdaten als auch der von mir gewählten Methoden in Analyse und Visualisierung sind die Diagramme zahlreichen Einflüssen und Entscheidungen ausgesetzt. Auch hier braucht es daher in Bezug auf die Daten – analog zur historischen Quellenkritik – eine entsprechende Datenkritik, und hinsichtlich meines Vorgehens bis hin zur fertigen Visualisierung eine entsprechende Methodenkritik.

Der analoge Weg

Würde man die Frage nach den jüngsten Entwicklungen des Fachs mit analogen Mitteln bearbeiten, würde man sicherlich die Zeitschriften der letzten Jahre nach Themen und Debatten durchsuchen, Rezensionen lesen und Anschaffungslisten der Bibliotheken und Programmhefte der Historikertage auswerten[2]. Um die Bearbeitung handhabbar zu halten, wäre hinsichtlich der zu analysierenden Jahre, Zeitschriften und Beiträge eine Auswahl zu treffen. Dennoch wäre ein Erhebliches an Zeit notwendig, um das notwendige Material zusammenzutragen und zu ersten Ergebnissen zu kommen.

H-Soz-Kult als “digitalisierte” Quellen

Im Falle von H-Soz-Kult hingegen steht das zu untersuchende Material bereits in digitaler Form zur Verfügung. Auch wenn man einschränken muss, dass dessen Aussagekraft erst mit der Zeit, das heißt mit der zunehmenden Akzeptanz und Verbreitung von H-Soz-Kult als fachinternes Medium zunimmt.

Die Anzahl der im Zeitraum von 1996 bis heute von H-Soz-Kult veröffentlichten Beiträge ist beeindruckend. Ganz aktuell sind dies – Stand 20.09.2018 – in den im Folgenden näher herangezogenen Kategorien:

15767 Buchrezensionen
11131 Call for papers
10845 Konferenzankündigungen [3]
7577 Tagungsberichte

Bereits für diese Kategorien stehen damit insgesamt 45.320 einzelne Dokumente zur Verfügung.

Das ist, das muss man hier sagen, eine erstaunliche redaktionelle Leistung, die im Printbereich so kaum denkbar wäre. Würde man nur diese Kategorien auswählen und pro Beitrag ganz vorsichtig eine durchschnittliche Länge von eineinhalb Seiten ansetzen, wären dies im Durchschnitt über alle Jahre hinweg mindestens 180 Druckseiten pro Monat, die auf dem Portal veröffentlicht wurden (und über den Newsletter potentiell auch in unserem Posteingang landeten).

Es wäre nun sicherlich möglich, diese Texte und Informationen analog zu Printpublikationen im klassischen hermeneutischen Verfahren zu bearbeiten. Das meint nach dem oben beschriebenen Verfahren eine bearbeitbare, das heißt lesbare Stichprobe zu erstellen und diese dann Dokument für Dokument auszuwerten. Dabei käme uns die aktuelle Präsentationsform der Texte ein ganzes Stück entgegen, ist es auf dem Portal doch möglich, alle Beiträge im Volltext zu durchsuchen, sich Übersichten zu den einzelnen Kategorien ausgeben zu lassen und diese nach verschiedenen Begriffen zu filtern (wenn auch nicht nach Publikationsdaten), und sich dann die einzelnen Beiträge anzeigen zu lassen. Ganz so, wie in dem oben genannten Beitrag beschriebenen Beispiel der 4000 Münzbeschreibungen und vielen anderen Fällen auch.  

H-Soz-Kult als genuin digitale Quellen

Damit wäre das Material zwar rasch zusammengetragen und ließe sich zudem einfacher erschließen. Doch auch dann wäre der Zeitaufwand für die Bearbeitung der Texte erheblich, die inhaltlichen Möglichkeiten jedoch weiterhin begrenzt. Oder wie lange würde es brauchen, bis man die verschiedenen inhaltlichen Entwicklungen im Fach über die letzten 10 bis 20 Jahre halbwegs gesichert beschreiben, sich neu herausbildende Themenkomplexe identifizieren oder den sich verändernden Stellenwert der einzelnen Verlage angemessen einschätzen könnte?

Dies ändert sich radikal, wenn man die von H-Soz-Kult veröffentlichten Texte und Informationen nicht mehr nur als Texte sondern auch als Daten versteht und mit digitalen Methoden bearbeitet. Dann eröffnen sich ganz neue Möglichkeiten und Fragestellungen, die sich in kürzester Zeit umsetzen lassen. Über den hermeneutischen Zugang hinaus können wir dann auch quantitative Methoden einsetzen, um über die Gesamtheit der Daten hinweg zu rechnen und die hier enthaltenen Informationen zu analysieren.

Mögliche Ansätze

Dabei sind verschiedene Methoden und Ansätze denkbar. Einerseits kann man die hier digital vorliegenden Texte zu einem Textkorpus zusammenfassen und mit den Techniken des Natural Language Processing (NLP) analysieren. Hier ließen sich Methoden wie das Topic Modelling anwenden, um mögliche Inhalte bzw. inhaltliche Tendenzen diachron über den gesamten Corpus hinweg auszulesen und danach fragen, wann bestimmte Themenfelder auftauchen und welchen Stellenwert sie im Bezug zum Gesamtkorpus einnehmen. Aber auch Ansätze der Sentimentanalyse wären denkbar, um die in den Rezensionen enthaltenen Wertungen maschinell zu erfassen und auswertbar zu machen. Schließlich könnte man nach wiederkehrenden Textstrukturen und Textfragmenten suchen und z.B. danach fragen, ob die Texte mit der Zeit standardisierter oder individueller werden.

Die Netzwerkanalyse wäre eine weitere Methode, die sich anwenden ließe. So könnte man danach Fragen, wie sich die Aktivitäten in der Community auf der Ebene einzelner Individuen strukturieren[4] und unter Einbezug von Ortsangaben und Themen analysieren, wie offen oder abgeschlossen bestimmte Gruppen und Themen sind. Hierzu wären die in den Dokumenten genannten Individuen anonymisiert auszulesen und mittels einer Graphdatenbank in einen Zusammenhang zu stellen.

Doch enthalten die einzelnen Dokumente bei H-Soz-Kult nicht nur die eigentlichen Texte, sondern auch die dazugehörigen Metadaten. Das sind Informationen zu den jeweiligen Texten selbst, aber aber zu den darin beschriebenen Ereignissen und Publikationen, um diese insbesondere inhaltlich näher beschreiben und einordnen zu können. Für deren Auswertung schließlich kann man auf die Methoden der Datenanalyse zurückgreifen, wie es im Folgenden beispielhaft geschehen soll.

Historische Datenanalyse am Beispiel von H-Soz-Kult

Die Methoden und Techniken, auf die hierbei zurückgegriffen werden, sind letztlich die gleichen wie die, um die es geht, wenn von Daten als Rohstoff, von business intelligence oder data mining gesprochen wird. Die enthaltenen, umfangreichen Daten werden quantifiziert und mit statistischen Verfahren analysiert. So können die Daten beschrieben und daraufhin auf potentielle Zusammenhänge, Entwicklungen und Tendenzen hin exploriert werden. Dabei ließen sich die hier verwendeten Methoden späterhin noch um Verfahren wie die automatische Klassifizierung oder die Clusteranalyse erweitern. Dabei wird immer auch auf das Mittel der Visualisierung zurückgegriffen, da Trends und Zusammenhänge über Tausende von Datensätzen auf diese Weise am Besten zu identifizieren sind – wobei, wie gesagt, die visuelle Evidenz nicht von der entsprechenden Daten- und Methodenkritik abhalten sollte.

H-Soz-Kult bietet zu den einzelnen Beiträgen umfangreiche Metadaten, die sich damit auswerten lassen. Hinsichtlich der Texte selbst sind hier noch einmal Informationen wie Titel, Autor, redaktionelle Betreuung und Veröffentlichungsdatum erfasst. Was die angekündigten oder berichteten Veranstaltungen angeht, so liegen Informationen zu Land, Ort, Veranstalter, Veranstaltungsort, Beginn und Ende der Veranstaltung sowie Konferenzsprache und etwaige Deadline vor. Bei Rezensionen umfassen die Informationen u.a. Autor, Titel, Typ der Veröffentlichung, Seitenzahl, Verlag und Preis. Alle über 45.000 Beiträge aus fast 22 Jahren sind zudem mit einer Reihe von Schlagworten zur inhaltlichen Beschreibung mit Bezug auf Epoche, Region und Thema versehen.

Um diese Daten aber tatsächlich auswerten zu können, müssen sie zunächst einmal zusammengetragen werden. Dazu wurde im vorliegenden Fall erst einmal ein sogenanntes web scraping oder auch data grabbing betrieben[5].  Das heißt, es wurde ein kleines Script in der Programmiersprache Python unter Verwendung der Module “Requests” und “Beautiful Soup” geschrieben, mit dessen Hilfe (natürlich nach vorheriger Rücksprache mit H-Soz-Kult) von den einzelnen Internetseiten der Plattform die interessierenden Informationen ausgelesen und als Daten in Tabellen zusammengetragen wurden. Anschließend wurden diese Daten zum Teil neu strukturiert und gereinigt (data cleansing), um sie anschließend mit dem Python-Modul “Pandas” codebasiert auszuwerten und zu visualisieren.

Beispiele für eine notwendige digitale Quellenkritik

Der Umstand, dass die Daten digital vorliegen, verlangt dabei nach ganz neuen Formen der Quellenkritik – sozusagen nach einer historischen Datenkritik. Beispielsweise gilt es, Ausreißer ausfindig zu machen und zu prüfen, ob die enthaltenen Daten plausibel sind oder nicht. So kann es z.B. vorkommen, dass im Jahr 2011 Veranstaltungen für das Jahr 2001 angekündigt werden, oder eine in Rom organisierte Tagung in den Metadaten in Deutschland verortet werden. Klassische Fehler bei der Dateneingabe, die je nach Fragestellung und Fokus von Bedeutung sein können oder vernachlässigbar sind.

Auch Fragen nach der Datenautorschaft und dem Rahmen der Datenerstellung sind zentral. Dies läßt sich insbesondere an den hier vergebenen Schlagworten illustrieren. So kann man die Schlagworte sicherlich zur Analyse heranziehen. Doch muss man fragen, wer die jeweiligen Schlagworte vergeben hat. War es die Redaktion von H-Soz-Kult, war es der Veranstalter selbst, der die Tagung auch inhaltlich konzipierte, oder war es doch eher das Sekretariat, dass die Ankündigung auf H-Soz-Kult im Rahmen eines zentralen Tagungsmangagements veröffentlichte? Es gilt also der große Vorbehalt, dass die Art und Weise, wie und von wem die Schlagworte ausgewählt wurden, auch die Aussagekraft der Analysen beeinflusst. 

Aber auch das Publikationssystem selbst und dessen Entwicklung kann die Wertigkeit der Ergebnisse beeinflussen. Datenmodell und Schlagwortliste können sich ändern, womit entsprechende Analysen über größere Zeiträume verzerrt werden.

Wichtig ist darauf hinzuweisen, dass die nachfolgenden Analysen und Visualisierungen nur vorläufigen Charakter haben und für eine endgültige Publikation sowohl ein noch genaueres Data Cleansing betrieben werden muss, als auch eine entsprechende  historische Quellen-, Daten- und Methodenkritik. Dies soll im Rahmen einer Masterarbeit geschehen, der ich an dieser Stelle nicht weiter vorweg greifen möchte. Im Folgenden möchte ich nur ein paar erste provisorische Perspektiven auf die H-Soz-Kult-Daten geben mit dem Ziel, an diesem Beispiel die Möglichkeiten der digitalen Methoden zu demonstrieren.

Erste Einblicke in die Daten

Die hier präsentierten Chart sind folglich nur erste Interpretationen der zusammengetragenen Daten. Sie können aber Ausgangspunkt weiterführende Überlegungen zur Digitalisierung der Geschichtswissenschaft, zu deren inhaltlichen Entwicklung und ihrer Tagungs- und Publikationskultur sein.

Etablierung einer digitalen Fachkommunikation am Beispiel von H-Soz-Kult

Im oben genannten Beitrag hatte ich behauptet, dass die Geschichtswissenschaft schon längst digital arbeitet und die über uns hereinbrechende Digitalisierung ein längst überholter Topos ist – zumindest, was ihre Organisation und Kommunikation angeht. Dies wird meines Erachtens durch die H-Soz-Kult-Daten bestätigt.

Das folgende Diagramm zeigt die jährlich veröffentlichte Zahl der hier untersuchten tagungsbezogenen Beiträge, also Call for Papers, Konferenzankündigungen sowie Tagungsberichte, für den Zeitraum zwischen 1997 und 2017.

Die Anzahl der in den jeweiligen Kategorien veröffentlichten Beiträge pro Jahr

Erklärungsbedürftig ist der Knick zum Jahr 2001 (wobei die vergebenen ID-Nummern der Beiträge nahelegen, dass die Daten für die Zeit von Juli 2000 bis Januar 2001 später – 2014?- überarbeitet wurden). Darüber hinaus sieht man eine stetige Entwicklung, die bei den Call for Papers noch immer anhält, bei den Tagungsberichten und Konferenzankündigungen hingegen seit dem Jahr 2008 bzw. 2010 weitgehend ein Plateau erreicht hat.

Interessant ist nicht nur, dass die Zahl der Call for Papers weiter steigt und die anderen beiden Kategorien bereits überholt hat. Dieser Befund kann auf eine veränderte Organisation und Kommunikation bei der Ausrichtung von Tagungen hinweisen, es mittlerweile vielleicht weniger Tagungen gibt, bei denen die Referentenliste von Anfang an feststeht. Vor allem aber kann man hier feststellen, dass das heutige Niveau in der Nutzung von H-Soz-Kult eigentlich schon bis ins Jahr 2010 zurückreicht.

Ähnlich ist das Bild, wenn man sich die Zahl der individuellen Beiträger anschaut – die aber nicht zugleich die Anzahl der unterschiedlichen Veranstalter abbildet, da einige Beiträge im Rahmen eines institutionseigenen Veranstaltungsmanagements erstellt wurden und einzelne Beiträger auf H-Soz-Kult auf über 50 Einzelbeiträge kommen.

Die Anzahl der individuellen Beiträger in den tagungsbezogenen Kategorien pro Jahr

Auch hier sieht man vor allem in den 2000er Jahren einen starken Zuwachs, der sich nach 2011 dann etwas verlangsamt. Der höchste Wert liegt 2017 bei insgesamt  1869 unterschiedliche Autoren in den hier untersuchten tagungsbezogenen Rubriken.

Hinsichtlich der Rezensionen ist das Bild noch aufschlussreicher. Im Folgenden sieht man die Zahl der Buchbesprechungen und der individuellen Autoren pro Jahr.

Vor allem zwischen 2001 und 2005 nahm die Zahl der Rezensionen wie auch der Beiträger erheblich zu, wobei eine leichte Verschiebung festzustellen ist. Danach setzt ein Plateau ein und die Zahlen sind seit 2013 wieder etwas rückläufig. Man könnte das Diagramm so interpretieren, dass in der Zeit von 2001 bis 2005 sich die Rezensenten besonders engagiert beteiligten. Hier wurden im Durchschnitt deutlich mehr Rezensionen pro Kopf geschrieben, mit einem Höchstwert von 1,41 Rezensionen pro Autor im Jahr 2004. Dieser Mehraufwand könnte dann dazu geführt haben, dass sich weitere Autoren am Portal beteiligten, so dass die Zahl der Autoren weiter anwuchs. Nach einem Höhepunkt im Jahr 2009 mit 1050 Rezensionen von 847 Autoren sind die Werte wieder etwas rückläufig, wobei das Verhältnis von Rezensionen pro Autor sich mittlerweile bei 1:1,13 eingepegelt hat (in den Jahren 2016 und 2017). Dieser Rückgang kann darauf zurückzuführen sein, aber das ist nur eine Vermutung, dass noch weitere Rezensionsportale entstanden sind (wobei es Sehepunkte aber auch schon seit 2001 gibt[6]). Oder aber, vielleicht sogar wahrscheinlicher, wir sehen hier schlicht den Effekt einer Normalisierung.

Was sich aus den Zahlen letztlich thesenhaft ableiten ließe, wäre eine stark wachsende Digitalisierung der Fachkommunikation in den 2000er Jahren, die, zumindest was H-Soz-Kult angeht, spätestens seit 2010 einen Zustand der Normalität erreicht hat –vielleicht auch schon eher. Dafür sprechen die über 1500 Beiträger in den Tagungskategorien und die über 800 individuellen Rezensenten pro Jahr. Was das angeht, arbeiten wir Historiker schon seit gut 10 Jahren sehr digital.

Inhaltliche Entwicklung des Fachs?

Was läßt sich darüber hinaus mit den Methoden der Datenanalyse zur inhaltlichen Entwicklung des Faches sagen? Dazu bietet es sich vor allem an, auf die inhaltlichen Schlagworte in den Metadaten zurückzugreifen. Doch müssen wir, wie oben angesprochen, hier erst einmal sicher gehen, dass alle Beiträge die Chance hatten, mit den gleichen Schlagworten ausgestattet zu werden.

Dies ist nicht der Fall. Viele Begriffe wie das Epochenschlagwort “21. Jahrhundert” wurden erst sukzessive eingeführt. Es ist also ein dynamisches System. Wann genau jedoch die jeweiligen Schlagworte eingeführt wurden, ist auf den Seiten von H-Soz-Kult, soweit ich sehen kann, nicht dokumentiert.

Die Veränderungen sind dennoch sichtbar, und zwar in den Daten. Dies soll im Folgenden an der Entwicklung der thematischen Schlagworte demonstriert werden. Wenn man die Erstnennung aller 95 thematischen Schlagworte erfasst und diese numerisch für jeweils 6 Monate in einem Histogramm aufaddiert, ergibt sich die folgende Grafik:

Der Zeitpunkt der Erstnennung der thematischen Schlagwörter in Halbjahren gestaffelt

Das heißt, dass die meisten Schlagworte in den ersten fünf Jahren erstmals verwendet wurden und 2002 dann weitere folgten. Eine weitere kleine Gruppe kam erst wieder 2010 hinzu, bevor das Schlagwortsystem im Juni 2016 noch einmal in einem größeren Umfang erweitert wurde.

Im Dezember 2009 und Januar 2010 wurden erstmals verwendet:

  • “Postkoloniale Geschichte”
  • “Historische Antisemitismusforschung”
  • “Rezeptionsgeschichte”
  • “Oral History / Zeitzeugen”
  • “Konsumgeschichte”
  • “Verkehrs- und Infrastrukturgeschichte”

Im Januar 2016 kam das Schlagwort “Emotionsgeschichte” hinzu, seit Juni des gleichen Jahres gefolgt von 22 weiteren, darunter: “Materielle Kultur”, “Körpergeschichte” oder auch “Finanz- und Bankengeschichte”[7].

Die Schlagworte zur Kennzeichnung der Regionen, mit denen sich die Tagungen und besprochenen Bücher auseinandersetzen, weisen bei der Erstverwendung hingegen eine deutlich breitere Streuung auf:

Der Zeitpunkt der Erstnennung der regionalen Schlagwörter nach Halbjahren gestaffelt

Hier ist der Zuwachs bis 2012 deutlich kontinuierlicher, bricht danach ab und nimmt in Folge des Juni 2016 noch einmal erheblich zu. Dann nämlich wurden vor allem außereuropäische Regionen neu und detailliert aufgenommen, mit eigenen Schlagworten beispielsweise für Brasilien, Zentralafrika, Senegal, Namibia, die Länder des ehemaligen Jugoslawiens und – ziemlich spät – auch für Portugal.

Diese Ergebnisse kann man unterschiedlich interpretieren. Es wäre natürlich danach zu fragen, mit welcher Intention diese Erweiterungen geschahen. Ging es darum, das Schlagwortsystem weiter auszudifferenzieren? Oder ging es darum, auf die inhaltlichen Veränderungen im Fach zu reagieren? Vielleicht beides? Das können die Redaktionsmitglieder sicher besser beantworten als ich. Aber es ist möglich, dass wir hier durch die Brille der Redaktion schon einmal Einblick in die inhaltlichen Veränderungen des Fachs erhalten, wenn Schlagworte wie “Emotionsgeschichte” und “Materielle Kultur” und für außereuropäische Regionen neu aufgenommen wurden. Eine Analyse der späteren Nutzung könnte weiteren Aufschluss bieten.

Aufsteiger in der Forschung zum 20. Jahrhundert

Um die inhaltliche Entwicklung über einen größeren Zeitabschnitt beobachten zu können, müssen wir also auf Schlagworte zurückgreifen, die bereits vor 2016 zur Verfügung standen.

Wie eine solche Analyse aussehen kann, möchte ich am Beispiel der Forschung zum 20. Jahrhundert demonstrieren – nicht zuletzt, weil diese Epoche auf H-Soz-Kult mit Abstand am stärksten vertreten ist und daher eine breite Datengrundlage bietet. Im Folgenden wird dafür die Vergabe thematischer Schlagworte in Rezensionen aufgelistet, geordnet nach dem jeweiligen Erscheinungsjahr der besprochenen Bände. Da deren Zahl seit dem Erscheinungsjahr 2003 mit jährlich 400-500 Bänden relativ konstant ist, wurde für die Analyse der Zeitraum zwischen 2003 und 2016 ausgewählt. Das sind insgesamt 6765 Besprechungen.

Für jedes Jahr wurde die Zahl der Nennungen der einzelnen Schlagworte erhoben, diese dann der Größe nach geordnet und auf dieser Grundlage mit Rangnummern versehen, die in den folgenden beiden Tabellen abgebildet sind. Die erste Tabelle ist nach dem Ranking des Jahres 2016 sortiert, wobei nur die obersten 15 Platzierungen angezeigt werden.

Die 15 wichtigsten Schlagwörter zu Rezensionen mit dem Epochenschlagwort „20. Jahrhundert“ , sortiert nach dem Erscheinungsjahr 2016

Wie also hat sich die Forschung zum “20. Jahrhundert” gemäß der zwischen 2003 und 2016 erschienen und auf H-Soz-Kult besprochenen Publikationen entwickelt? Diese Übersicht würde zumindest nahelegen, dass das Schlagwort “internationale Beziehungen” durch “transnationale Geschichte” abgelöst wurden, “Wissenschaft” und “Wissensgeschichte” einen deutlichen Aufstieg erfuhren, wie auch das Schlagwort “Soziales”. Das Schlagwort “NS/Faschismus” hingegen verliert leicht (was dann an den tatsächlichen Zahlen genauer zu prüfen wäre). Prinzipiell kann man aber auch feststellen, dass in der Forschung zum 20. Jahrhundert, anders als z.B. für das Mittelalter, die Politikgeschichte durchgängig vor der Kulturgeschichte steht.

Absteiger in der Forschung zum 20. Jahrhundert

Indem man den der Tabelle zugrundeliegenden Algorithmus nur an einem Parameter verändert, kann man auch nach den Absteigern fragen. Hier die gleiche Tabelle, nun nach dem Ranking  des Jahres 2003 sortiert.

Die 15 wichtigsten Schlagwörter zu Rezensionen mit dem Epochenschlagwort „20. Jahrhundert“ , sortiert nach dem Erscheinungsjahr 2003

In den oberen Plätzen hat sich offenbar wenig getan, abgesehen u.a. von den wohl leicht zurückgehenden Gebrauch des Schlagworts “NS / Faschismusgeschichte”. Danach jedoch gibt es sehr signifikante Veränderungen. So wurde das Schlagwort “Jüdische Geschichte” wohl deutlich seltener gebraucht und auch die Schlagwörter “Historiografiegeschichte”, “Historische Diskursanalyse”,“Theorien und Methoden der Geschichtswissenschaft”, und in einem besonderen Maße “Verfassungsgeschichte” wurden im Vergleich zu anderen über den Untersuchungszeitraum hinweg erheblich seltener gebraucht.

Diese Analyseergebnisse müssten gegebenenfalls methodisch noch einmal besser abgesichert und an den absoluten Zahlen geprüft werden, um tatsächlich belastbar zu sein. Aber sie scheinen doch signifikant.

An dieser Stelle sind wir dabei schon längst bei der explorativen Datenanalyse angekommen, für die uns noch weitere Methoden zur Verfügung stehen: So ließe sich zum Beispiel die Trendanalyse anwenden, um zu prüfen, was die Daten hinsichtlich des proportionalen Zuwachses in der Verwendung der einzelnen Schlagworte sagen, um mögliche Einblicke dahingehend zu bekommen, welche Themenfelder den stärksten Zuwachs zu verzeichnen haben.

Andererseits kann man mit der Korrelationsanalyse untersuchen, welche Schlagworte überproportional häufig gemeinsam vorkommen oder in Kombination mit welchen regionalen Schlagworten. Das befördert viel Erwartbares zu Tage, bringt aber auch einige neue Perspektiven.

So läßt sich über die für das 20. Jahrhundert herangezogenen Daten beispielsweise sagen, dass “Erinnerungsforschung / Gedächtnisgeschichte” überproportional häufig gemeinsam mit “Geschichtsvermittlung, Didaktik und Public History” (Korrelationskoeffizient: 0,41) und “Oral History / Zeitzeugen” (0,26) genannt wird, was auch für die beiden oben genannten verstärkt auftretenden Schlagworte “Kultur” und “Soziales” gilt (Korrelationskoeffizient: 0,35).

Aber wie gesagt, man kann frei in den Daten explorieren und schauen, ob sich außergewöhnliche oder erklärungsbedürftige Muster finden lassen.

Organisation, Strukturen, Tagungs- und Publikationskultur

Letztlich sei an dieser Stelle nur noch darauf hingewiesen, dass – wenn die (Forschungs-)Daten einmal vorliegen – die gleichen Analysen ebenso für Fragen der Organisation des Faches, nach dessen Strukturen und seiner Tagungs- und Publikationskultur möglich sind.

So kann man die Daten danach befragen, an welchen Orten zu welchen Epochen besonders häufig Tagungen organisiert werden, oder auch, wie viele Seiten die hier besprochenen Bücher und insbesondere die Dissertationen haben, wie teuer diese sind und bei welchen Verlagen sie erschienen sind – und wie sich all diese Werte über die letzten 20 Jahre verändert haben. Dem Fragenden sind dabei nur wenige Grenzen gesetzt.

Am Ende möchte ich anhand der Daten noch eine kleine praktische Frage der Tagungsorganisation und des akademischen Jahres beleuchten. Dabei geht es nicht um die Frage, wie viel Zeit man den potentiellen Teilnehmern lässt, um sich auf einen Call for papers zu bewerben (Median[8]: 41 Tage), und wie viel Zeit nach Bewerbungsschluss bis zur Tagung vergeht (Median: 118 Tage). Nein, es geht um die Frage, in welchen Monaten im Durchschnitt die meisten Tagungen stattfinden. Dazu wurden für jeden Monat  alle im Datenset genannten Tagungen aufaddiert. Dabei ergibt sich folgendes Bild:

Die in den tagungsbezogenen Kategorien erfassten Tagungen nach Monat

Wie möglicherweise erwartet, finden die meisten Tagungen im September (4156) statt, gefolgt von November (3952) und Oktober (3723). Erst dann kommen wir in die erste Jahreshälfte mit Juni (3254) und März (2541). Am seltensten finden Tagungen im Januar (1048) und vor allem im August (673) statt. Insgesamt haben wir also eine recht unproportionale Verteilung, die sich zumindest teilweise mit dem akademischen Jahr, den Semesterferien, Weihnachten und Sommerurlaub erklären lassen. Warum das Wintersemester dem Sommersemester dennoch so deutlich vorgezogen wird, wäre aber noch zu erklären. Wie in der folgenden Grafik zu sehen, schwankt diese Verteilung über die Jahre nur leicht (jedes Jahr von 1998 bis 2018 ist eine Linie):

Die in den tagungsbezogenen Kategorien erfassten Tagungen nach Monat für die einzelnen Jahre

Rechtliche Fragen

Eine Frage, die in diesem Zusammenhang nicht näher besprochen werden kann, auf die ich aber hier unbedingt aufmerksam machen möchte, ist die nach den rechtlichen Bedingungen im Umgang mit diesen Daten und damit mit Forschungsdaten. Wenn ich die Daten nur einer Quelle entnehme und zu wissenschaftlichen Zwecken verwende, kann ich die Ergebnisse dennoch frei publizieren? Und, kann ich auch die von mir erstellten und überarbeiteten Datensammlungen als Forschungsdaten publizieren?

Schluss

Alle hier gezeigten Analysen sind allein codebasiert entstanden. Das heißt, sie wurden als Algorithmus ausformuliert und sind bei entsprechender Dokumentation immer replizierbar. Vor allem aber lassen sich diese Scripte, einmal geschrieben, an die unterschiedlichsten Fragestellungen anpassen. So können die oben für das 20. Jahrhundert durchgeführten Berechnungen ebenso auf die Rezensionen zum “16. Jahrhundert”, zum “Mittelalter” oder der “Alten Geschichte” angewandt werden. Man kann in der gleichen Weise aber auch englischsprachige oder mit den regionalen Schlagworten “Frankreich”, “Großbritannien” oder “Osteuropa” versehenen Veranstaltungen und Rezensionen analysieren. Man kann auf H-Soz-Kult bekannt gemachte Tagungen im In- und Ausland miteinander vergleichen, oder Tagungen an unterschiedlichen Tagungsorten auswerten, in synchroner wie diachroner Perspektive. Mit der Änderung einiger weniger Parameter im Code können so immer wieder neue Visualisierungen und damit neue Perspektiven auf die gesammelten Daten erstellt werden. Das alles ist möglich, wie gesagt, immer vorbehaltlich einer entsprechenden Quellen-, Daten- und Methodenkritik.

Die Perspektiven der digitalen Methoden reichen dabei noch weiter: So lassen sich diese Datenanalysen bei entsprechender Aufbereitung per Linked Data um Informationen zu Personen, Projekten und Institutionen aus weiteren Datenquellen wie der Gemeinsamen Normdatei (GND), wikidata oder DBpedia und damit um Informationen beispielsweise zu Alter, Geschlecht, Publikationen aber auch Standort und Zugehörigkeit zu größeren Verbünden erweitern und auch mit den Ergebnissen der Netzwerkanalyse oder der Sprachanalyse kombinieren.

Ich hoffe, dass ich damit zumindest einen kleinen Einblick bieten konnte, welche Möglichkeiten sich mit den digitalen Methoden für die Geschichtswissenschaften eröffnen, wenn wir digitale bzw. digitalisierte Quellen nicht mehr nur als Quellen, sondern auch als Daten verstehen und bearbeiten.

___________________

  1. Zu den Anfängen von H-Soz-Kult: Rüdiger Hohls, Peter Helmberger: H-Soz-u-Kult: Eine Bilanz nach drei Jahren. In: Historical Social Research/Historische Sozialforschung 24, 1999, Heft 3, S. 7–35 (urn:nbn:de:0168-ssoar-31699).
  2. Für vergleichbare frühere Studien siehe  Olaf Blaschke, Verleger machen Geschichte. Buchhandel und Historiker seit 1945 im deutsch-britischen Vergleich, Göttingen 2010, sowie ders., Der Markt für Zeitgeschichtsforschung: Ein Plädoyer für mehr Empirie, in: Zeithistorische Forschungen 6 (2009), S. 441–448 (online).
  3. Hinzu kommen u.a. noch Ankündigungen für 1862 Colloquia und 2933 Workshops, wobei die Unterscheidung zwischen den einzelnen Veranstaltungstypen nicht immer eindeutig ist.
  4. Vgl. dazu bereits die kleine Studie von Daniel Burckhardt, Comparing Disciplinary Patterns: Exploring the Humanities through the Lens of Scholarly Communication, in:  Digital Humanities Quarterly 11(2) 2017, http://www.digitalhumanities.org/dhq/vol/11/2/000298/000298.html.
  5. H-SozKult. Kommunikation und Fachinformation für die Geschichtswissenschaften, Internet: https://www.hsozkult.de/. Die Daten für die tagungsbezogenen Kategorien Calls for Papers, Konferenzankündigungen und wurden im Zeitraum vom 10.-16. Juli 2018, die für die Rezensionen am 29. Juli von H-Soz-Kult heruntergeladen.
  6. http://www.sehepunkte.de/ueber-uns/.
  7. Genau sind es: „Ethik- und Wertevorstellungen“, „Identitätskonstruktion“, „Materielle Kultur“, „Körpergeschichte“, „Theatergeschichte- und wissenschaft“, „Geschichte der ländlichen Bevölkerung“, „Architekturgeschichte“, „Film / Fernsehen / Radio“, „Zivilgesellschaft“, „Sozialpolitik und Sozialstaat“, „Verwaltungs- und Institutionengeschichte“, „Justiz und Polizei“, „Holocaust, Shoa, Genozid“, „Politische Ideen, Ideologien“, „Finanz- und Bankengeschichte“, „Internationale Organisationen“, „Regionen / Regionalisierung / Regionalismus“, „Sportgeschichte“, „Wirtschaftspolitik“.
  8. Wegen der Ausreißer wird hier der Median genutzt, und das auch nur für die positiven Zahlen. Es gibt auch Beiträge mit Minuswerten – was sicherlich, so ist zu hoffen, auf Fehler bei der Eingabe zurückgeht.

Empfohlene Zitierweise:

Torsten Hiltmann: H-Soz-Kult als Quelle der jüngsten Fachgeschichte. Die Potentiale der digitalen Geschichtswissenschaft am Praxisbeispiel, in: Digitale Geschichtswissenschaft (ISSN 2199-0603), erschienen: 25.09.2018, Internet: https://digigw.hypotheses.org/2999.

 


Viewing all articles
Browse latest Browse all 17

Latest Images