Universität Erfurt

Forschung und Nachwuchsförderung an der Universität Erfurt

Ein virtueller Zettelkasten für die Geschichte.: Dr. Olaf Simons nutzt die Software Wikidata für eine historische Datenbank

Projektlogo

„Manche Fragen kann ich nicht stellen, ohne eine bestimmte technische Lösung dafür zu haben“ – diese Erkenntnis gewann Olaf Simons, wissenschaftlicher Mitarbeiter am Forschungszentrum Gotha der Universität Erfurt, bereits während der Arbeit an seiner Dissertation. Damals forschte er zum Romanangebot des frühen 18. Jahrhunderts – und stand der Frage gegenüber: Wie lassen sich diese eigentlich nach Publikationszeitpunkt erfassen? Wie viele Romane, ob alte oder Ersterscheinungen, kamen in welchem Jahr auf den Markt? Karteikataloge ermöglichten zwar Autor-, Titel- oder Schlagwort-Recherchen, doch nach Druckjahren ließen sich die Bestände nicht filtern. Einem ähnlichen Problem stand Simons auch in einer späteren Untersuchung gegenüber: Im Rahmen des Projektes „Bertelsmann im Dritten Reich“ wollte er erforschen, womit der Verlag seine Gewinne erzielte. Kalkulationen aller einzelnen Verlagsprojekte lagen in Papierstapeln vor und mussten erst einmal für eine Berechnung digital erfasst werden, bevor der Historiker sich an die Beantwortung seiner Forschungsfragen machen konnte. Etwa zur gleichen Zeit entstand eine neue Internetplattform namens Wikipedia, die es jedermann erlaubte, Texte zu Stichworten online zu verfassen, zu bearbeiten und der Allgemeinheit zur Verfügung zu stellen. Simons war von Beginn an fasziniert von der Online-Enzyklopädie mit all ihren Vor- und ihren Nachteilen. Ihn erfasste schnell eine „gewisse Suchtwirkung“ bei der Bearbeitung historischer Themen. Mittlerweile hat er die Autorentätigkeit für Wikipedia gegen ein anderes Wikimedia-Projekt eingetauscht: Für das Verbundprojekt „Gotha um 1800. Natur – Wissenschaft – Geschichte“ von Forschungsbibliothek Gotha und Forschungszentrum Gotha der Universität Erfurt sowie der Stiftung Schloss Friedenstein arbeitet er am sogenannten „FactGrid“, einer Wikimedia-Entwicklung, die Datenbankfunktionen für historische Faktenbestände übernimmt.

„Mit der bisherigen Wiki-Software kann man Internetseiten generieren und untereinander verbinden“, erklärt Simons. „Dabei hinterlässt jeder, der in einem Wiki etwas schreibt, seine Spuren, die von allen nachvollzogen werden können. Wie eben in Wikipedia, wo ganz viele Autoren beitragen und gleichzeitig die Inhalte überwachen.“ Angetan von der Transparenz und der möglichen Reichweite eines Wikis begann der Wissenschaftler 2013, gemeinsam mit seinen Kollegen am Forschungszentrum Gotha für ein Projekt über den Geheimorden der Illuminaten ein Wiki aufzubauen, das heute mit über drei Millionen Zugriffen zwar sehr erfolgreich läuft, das der Gothaer Forschergruppe aber auch schnell die Grenzen des Wiki-Systems offenbarte: Zum einen kann hier von der ursprünglich deutsch generierten Information nicht mühelos zu einer anderen Sprache gewechselt werden, was den globalen Zugriff erschwert; und zum anderen ist eine große Autoren-Gemeinschaft erforderlich, um auch die Kleinarbeiten im Gesamtsystem vornehmen und Änderungen jederzeit überblicken zu können. Bei dem kleinen Illuminaten-Wiki eine schwierige Aufgabe. „Deshalb ist eine Datenbank die elegantere Lösung für Projekte, in denen vor allem auch Fakten, Aussagen, verwaltet werden“, stellte Olaf Simons fest – und ging damit den Weg, den Wikimedia zeitgleich beschritt. Seit 2012 arbeitet die durch Spenden finanzierte Plattform an „Wikibase“ einer Datenbanksoftware, deren erstes Kind „Wikidata“ heute alle Wikipedia-Instanzen miteinander verbindet. „Ich beobachtete die Entwicklung von Wikidata von Beginn an und habe schon früh meine Fühler zu den Entwicklern ausgestreckt, da gerade ein solches Datenbanksystem für den wissenschaftlichen Bereich enorm interessant sein musste“, erinnert sich Simons. So kam es schließlich, dass sein aktuelles Projekt – das FactGrid – eine der ersten Wikibase-Instanzen außerhalb von Wikidata wurde. Als ersten Schritt hat das Team um Simons die vorhandenen Wiki-Daten aus dem Illuminatenprojekt in den „virtuellen Zettelkasten“, wie Simons das FractGrid nennt, übertragen – mehr als 16.000 einzelne Datensätze aus fast 9.000 Akten: Namen, Lebensdaten, Korrespondenzen und andere zuvor in mühevoller Recherchearbeit zusammengetragene Informationen zu allen 1.350 nachgewiesenen Mitgliedern des Illuminatenordens. Diese können nun nicht nur in verschiedenen Sprachen abgerufen, sondern auch nach den unterschiedlichsten Fragestellungen gefiltert werden. Dadurch kann der Nutzer nahezu unbemerkt zwischen dem Wiki und der Datenbank hin- und herspringen und auf alle möglichen Querverweise zurückgreifen. Im zweiten Schritt geht es nun nicht mehr allein um die Illuminaten. Die Datenbank soll jetzt anwachsen und mit den unterschiedlichsten historischen Daten befüllt werden. „Die Software erlaubt es, ganz verschiedene Projekte nebeneinander laufen zu lassen“, so Olaf Simons. „Wenn diese sich nicht berühren, ist das kein Problem. Richtig spannend wird es aber natürlich dann, wenn es Schnittpunkte gibt.“

Porträt Olaf Simons
Dr. Olaf Simons

In dieser Funktion ist das FactGrid eine ganz klassische Instanz der Digital Humanities (DH) – aber mit besonderer Flexibilität. Jedes Forschungsprojekt kann hier Forschungsfragen und Objekt-Eigenschaften nach Belieben festlegen. Es können Verknüpfungen mit Geokoordinaten und Karten, mit Netzwerken, Namen, Quellen, Stammbäumen etc. erstellt werden. Einiges davon erfordert immer noch etwas Fleißarbeit, aber ein Vorteil der Software sei es, dass sie auf die Arbeit am einzelnen Gegenstand sowie auf die automatische Befüllung mit bereits bestehenden Daten hin angelegt ist. „Es geht also nicht darum, alle Daten einzeln einzugeben, sondern zunehmend darum, bestehende Datensätze klug zu nutzen. Zum Beispiel bei unserem Projekt ‚Gotha um 1800‘: Hier hat uns das Stadtarchiv Häuserlisten der Jahre 1828, 1841 und 1846 mit Besitzerinformationen aus den Adressbüchern in Excel-Dateien zur Verfügung gestellt. Das Thüringer Landesamt für Vermessung bietet seinerseits Geokoordinaten zu allen heutigen Adressen an. Wo wir von Schnittmengen ausgehen konnten, ließen wir die Datenbank die Informationen verbinden. Wo dagegen Neubauten ganze Straßenzüge verschoben, müssen wir von Hand nacharbeiten. Man wird im Verlauf die Datenbank befragen können, wo in Gotha Schuhmacher wohnten und wo Regierungsangestellte“ – und auch wo Anhänger des Illuminatenordens. Denn auch aus dem bestehenden Wiki und den ins FactGrid übertragenen Informationen zu dem Geheimorden können die Forscher nun für ihr aktuelles Projekt schöpfen, geht es doch mit Gotha um denselben Wirkungsort und zum Teil auch um dieselben Personen.

Für Simons und seine Kollegen steht nun ein weiterer großer Schritt in der Weiterentwicklung der Erfurter FactGrids bevor: eine Kooperation mit der Deutschen Nationalbibliothek, um Daten aus der von ihr betreuten Gemeinsamen Normdatenbank (GND) – der für den deutschsprachigen Raum umfangreichsten „Normdatei für Personen, Körperschaften, Konferenzen, Geografika, Sachschlagwörter und Werktitel“ – im FactGrid bearbeitbar zu machen. Zum Beispiel die Daten von Herzog Ernst II. von Sachsen-Gotha-Altenburg (1745–1804). Er ist eine historische Person, die eine Schnittstelle bildet zwischen den Datensätzen der Illuminaten – er wurde 1783 Mitglied des Geheimbundes – und aufgrund seiner Lebensdaten denen des Projektes „Gotha um 1800“. Und: Er hat eine GND-Nummer, das heißt, auch in der GND ist ein Datensatz zu ihm hinterlegt. Dieser ist mit dem FactGrid bisher nur über einen Link verbunden. Olaf Simons‘ Idee geht aber einen Schritt weiter: „Wir würden seine – und auch alle anderen – GND-Daten gern komplett in unseren Datensatz integrieren und der Bearbeitung durch die wissenschaftliche Community öffnen. Die Deutsche Nationalbibliothek spielte glücklicherweise mit denselben Gedanken, sodass wir derzeit an einem gemeinsamen ‚Memorandum of Understanding‘ arbeiten. Wir hoffen nun, ab März erste Daten übertragen zu können.“

Erfolge wie die Zusammenarbeit mit der GND bestärken Olaf Simons in seiner Zuversicht, dass Erfurts FactGrid zunehmend interessant für andere historische Forschungsprojekte und Bewahrer historischer Daten wird. Er ist überzeugt, dass DH-Projekte wie dieses der geisteswissenschaftlichen Forschung insgesamt zu mehr Resonanz verhelfen können. Die Möglichkeit der klugen Nutzung bestehender wissenschaftlicher Daten in seinem „Zettelkasten“ ist eine Maßnahme auf diesem Weg. Und mit der Einbindung von Bürger- und Schülerwissen für sein Projekt zu „Gotha um 1800“ ganz im Sinne der sogenannten „Citizen Science“ hat er auch schon wieder den nächsten Schritt im Kopf…

 

Weitere Informationen:

Navigation

Werkzeugkiste

Nutzermenü und Sprachwahl