UrNet

Eine Wissensbasis von Urkunden zur Generierung von Netzwerken

Bearbeiter: Dr. Christian Knüpfer, Clemens Beck

In dieser Machbarkeitsstudie wurde untersucht, wie aus textuellen Daten (Urkunden) semi-automatisch Netzwerke generiert werden können. Der verwendete Ansatz sieht eine formale Repräsentation von aus den Urkunden extrahiertem Wissen in einer Wissensbasis vor. Durch Angabe expliziter Kriterien werden aus der Wissensbasis automatisch Netzwerke generiert, die anschließend vom Historiker analysiert und interpretiert werden können.

Als historisches Fallbeispiel wurde die deutsche Adelsgesellschaft während der Regierungszeiten der Kaiser Friedrich Barbarossas (1152 – 1190) und Heinrich VI. (1190 – 1197) mit Mitteln der sozialen Netzwerkanalyse untersucht.

Die historischen Ergebnisse des Projekts fließen in die Promotion von Clemens Beck ein (siehe Projektbeschreibung). Die Machbarkeitsstudie wurde auf dem International Medieval Congress 2018 in Leeds präsentiert (siehe Präsentation von C. KnüpferExterner Link und C. BeckExterner Link).

Konkret sieht der im Projekt verwendete Workflow wie folgt aus:

Im Projekt verwendete Workflow
Im Projekt verwendete Workflow
Abbildung: MEPHISTO, CC BY 4.0
Urkundenausteller aus dem Zeitraum zwischen 1160 und 1199
Urkundenausteller aus dem Zeitraum zwischen 1160 und 1199
Abbildung: MEPHISTO, CC BY 4.0

1. Datenerhebung (manuelle Kuration)

Die aus den Urkunden erhobenen Daten wurden in einer Excel-Liste abgelegt.

Dafür wurden insgesamt 2068 Urkunden aus dem Zeitraum zwischen 1160 und 1199 ausgewertet. Davon wurden ein Drittel am kaiserlichen Hof ausgestellt und ein Sechstel an den Höfen der deutschen Erzbischöfe. Der Rest verteilt sich auf die weiteren Reichsfürsten, wie der Grafik zu entnehmen ist.

Es wurden nur Urkunden aufgenommen, wenn zwei oder mehrere hochrangige Angehörige der hochmittelalterlichen Adelsgesellschaft (weltliche Fürsten ab dem Rang von Grafen sowie Äbte, Bischöfe und Erzbischöfe) sowie  am politischen Prozess der Ausfertigung der Urkunde (durch Zeugenschaft, Intervention oder Petition) beteiligt waren und namentlich genannt wurden. Das bedeutet, dass sie persönlich am Hof des Ausstellers anwesend gewesen waren und sich dort für eine längere Zeit aufgehalten haben.

Bei der Auswertung der Urkunden werden vier verschiedene Gruppen von Personen unterschieden: Der Aussteller einer Urkunde, der Empfänger, der Intervenient und die Zeugen der Urkunde. Insgesamt wurden 990 Personen aufgenommen, die mindestens einmal in mindestens einer Urkunde erwähnt. Für weitere historische Untersuchungen wurde jede Person einer historischen Region wie Bayern oder Niederlothringen und zumeist auch einer von insgesamt 170 Familien zugeordnet.

2. Überführung in Wissensbasis (Skript)

Die Einträge aus der Excel-Liste wurden mittels eines Python-Skripts ausgelesen und in eine Prolog-Wissensbasis überführt.

3. Generierung von Netzwerken

Zur Generierung eines Netzwerks müssen Kriterien angegeben werden, die festlegen, was die Knoten eines Netzwerks sind und wann eine Kante zwischen zwei Knoten besteht. Diese Kriterien können dann in entsprechende Prolog-Regeln übersetzt werden. Der Schlussfolgerungsmechanismus von Prolog kann dann verwendet werden, um Netzwerke entsprechend diesen Kriterien zu generieren. Anschließend werden die Netzwerke zur weiteren Analyse in eine CSV-Datei geschrieben. Ein Beispiel für eine solche Regel ist:

Es gibt eine Kante zwischen zwei Personen im Netzwerk, genau dann, wenn sie als gemeinsame Zeugen einer Urkunde angeführt sind.

Für die Generierung eines Netzwerks können zusätzlich die zugrunde gelegten Urkunden nach bestimmten Eigenschaften gefiltert werden, wie etwa dem Ausstellungsdatum und dem Aussteller der Urkunden.

Im Projekt wurden Regeln für bestimmte Beziehungstypen bereits vordefiniert, z.B. co-certification (siehe Beispiel oben) und loyality (Beziehung zwischen Zeuge und Aussteller einer Urkunde).

Beispielsweise ließen sich so etwa für die Beziehung co-certification aus den 2068 Urkunden und 990 Personen knapp 50 000 Verbindungen generieren.

4. Analyse und Visualisierung der Netzwerke

Aus diesen Netzwerk-Daten wurden am Ende mittels Gephi die entsprechenden Netzwerke erzeugt, welche die verschiedenen Gruppierungen in der hochmittelalterlichen Adelsgesellschaft abbilden, wie beispielsweise hier zu sehen ist:

Eine Analyse der Netzwerke kann etwa mit  Gephi oder mit R erfolgen.
Eine Analyse der Netzwerke kann etwa mit Gephi oder mit R erfolgen.
Abbildung: MEPHISTO, CC BY 4.0