Das Drama Corpora Project
DraCor ist eine kostenlose, webbasierte, offene Plattform zur Dramenforschung. DraCor transformiert vorliegende Textsammlungen in programmierbare Korpora. Es stehen sechs verschiedene Dramenkorpora zur Verfügung mit Texten, die zwischen 1730 und 1930 erschienen.
DraCor generiert automatisch Figuren-Netzwerke und stellt verschiedene Textuntermengen bereit wie den gesprochenen Text einer Figur, die Regieanweisungen oder die Texte der weiblichen bzw. männlichen Figuren.
DraCor enthält 473 deutschsprachige, 163 russische und zudem griechische, römische, spanische und viele Shakespeare Dramen. Den deutschen Texten liegt das TextGrid Repository zugrunde.
DraCor wird herausgegeben von der Universität Potsdam und vom Centre for Digital Humanities an der HSE Moskau. Das Korpus steht unter der Lizenz CC0 (no rights reserved).
Die Daten können in verschiedenen Formaten exportiert und weiterbearbeitet werden als TXT-, RDF-, CSV-, GEXF- oder JSON-Dateien. Es ist keine Registrierung notwendig.
Distant Reading und Digital Humanities
Im Post Digital Humanities und Distant Reading habe ich in die Grundidee der quantitativen Textanalyse eingeführt und im Post Distant Reading mit Voyant eine Analyselandschaft vorgestellt.
Unter dem Begriff Digital Humanities werden “Neuerungen in den Geisteswissenschaften zusammengefasst, die auf der gezielten Anwendung digitaler Forschungsressourcen beruhen.” (sagw) Typische Arbeits- und Forschungsfelder sind digitale Editionen, Visualisierungen komplexer Datenstrukturen und die quantitative Textanalyse.
Distant Reading ermöglicht es, mit Hilfe computergestützter Verfahren ganze Korpora zu lesen und zu visualisieren. Durch Abstraktion werden aus Theaterstücken Netzwerke. Handlungen bestehen aus Figuren und Aktionen, ein Netzwerk aus Knoten und Kanten. Mit der Plattform DraCor lassen sich solche Netzwerke einfach erstellen. Bei den folgenden Ausführungen stütze ich mich auf Jan Horstmanns Artikel DraCor: Drama Corpora Project.
Fragestellungen im Unterricht
DraCor wird vor allem für wissenschaftliches Arbeiten genutzt, kann aber auch im Unterricht eingesetzt werden. Das Hauptziel von DraCor ist es, „einen Ausgangspunkt für verschiedene digitale Projekte bereitzustellen“, für die man sich die Daten herunterladen kann. (forText) Die exportierten Daten können z.B. mit Voyant oder Gephi weiterverarbeitet werden.
Mögliche DraCor-Fragestellungen zu Wedekinds „Frühlingserwachen“sind beispielsweise:
- Wie sieht die Personenkonstellation des Dramas aus?
- Welche Figuren treten im Akt II von „Frühlings Erwachen“ gemeinsam auf?
- Wie hoch ist der Anteil Wendlas am gesprochenen Text?
- Wie sieht in Bezug auf den gesprochenen Text das Verhältnis weiblicher und männlicher Figuren aus?
- Ist der Anteil der Regieanweisungen in diesem naturalistischen Drama tatsächlich höher als in einem Drama einer anderen Epoche?
Textsuche und ein Netzwerk erstellen
So laden Sie Frank Wedekinds Text „Frühlings Erwachen“ und generieren daraus eine Personenkonstellation:
- Starten Sie auf https://www.dracor.org/ und klicken Sie auf „German Drama Corpus“.
- Das Korpus kann nach Autor*in, Titel, Netzwerkgrösse, Erscheinungsjahr und Textquelle gefiltert werden.
- Suchen Sie nach „Wedekind“.
- Wählen Sie das Drama „Frühlings Erwachen“ aus und zoomen Sie dann in das Netzwerk hinein.
- Im Reiter „Network“ wird die Personenkonstellation präsentiert:
- „Speech distribution“ bietet zwei Visualisierungen an:
- Im linken Diagramm die Szenennummern mit der Anzahl Charaktere pro Szene.
- Im rechten Diagramm wird die Häufigkeit der Szenen mit einem, zwei bis n Charakteren pro Szene visualisiert:
Im Bereich „Metrics“ werden statistische Angaben bereitgestellt. Diese Netzwerkdaten kann man als CSV- oder als GEXF-Dateien herunterladen.
- Die Personenliste „Cast list“ ist nach der Chronologie des Auftretens der Personen im Drama geordnet:
DraCor API – Download von Netzwerkdaten
Eine API bietet verschiedenartige Metadaten an:
- strukturelle Daten zu Akten, Szenen, Regieanweisungen und Seitenumbrüche zur Orientierung im Text
- semantische Daten wie das Geschlecht der Figuren
- weitere Daten wie Autor, Erscheinungsdatum, Veröffentlichung, Premiere des Stücks, Figurennamen, Links zur Textquelle
Klickt man auf den Link „API“ und dann auf „public“, können Einzeltexte, Textteile und Metadaten exportiert werden:
- Personenlisten
- der gesprochene Text (ohne die Bühnenanweisungen) mit der Möglichkeit, diesen nach dem Geschlecht zu filtern
- der gesprochene Text einzelner Figuren
- die Bühnenanweisungen
- Weitere Daten: Listen mit allen verfügbaren Korpora, mit dem Inhalt eines Korpus, mit den Metadaten aller Dramen eines Korpus, mit den Metadaten und den „network metrics“ oder ein TEI- oder ein RDF-Dokument eines einzelnen Dramas. Zudem kann man die Netzwerkdaten eines Dramas im CSV- oder im GEXF-Format (für die Weiterverarbeitung mit Gephi) herunterladen.
Erstellen einer Personenliste
- In der API kann man im Bereich public /corpora/{corpusname}/play/{playname}/cast eine Personenliste des Dramas erzeugen lassen.
- Dazu klickt man vor der Funktion auf „Get“ und dann auf „Try it out“.
- Jetzt gibt man im Feld „corpusname“ den Korpusnamen „ger“ ein und im Feld „play name“ den Titel des Dramas „wedekind-fruehlings-erwachen“. Die Syntax des Werknamens findet man im Link, der zu dem Drama führt.
- Mit „Execute“ wird die Personenliste generiert.
- Im Feld „Request Url“ erhält man einen Link, mit man das Resultat speichern oder teilen kann, im Bereich „Response body“ steht die Personenliste als Download bereit:
Genderspezifisches Filtern
Möchte man nur den gesprochenen Text der weiblichen Figuren exportieren, geht man z.B. wie folgt vor:
- Man wählt „Get spoken text of a play (excluding stage direxctions)“.
- Dann klickt man auf „Get“ und schliesslich auf „Try it out“.
- Dann füllt man die Suchmaske aus und wählt bei „gender“ „FEMALE“.
- Mit „Execute“ wird die Liste bereitgestellt.
Eigene Netzwerke aufbauen
Für dramatische Texte, etwa Dramenfragmente wie Büchners „Woyzeck“, die in DraCor nicht verfügbar sind, kann man mit Ezlinavis selbst ein Netzwerk aufbauen. Wie das gemacht wird, erkläre ich in meinem nächsten Post.
Links
- Drama Corpora Project: https://www.dracor.org
- Ezlinavis. Tool für das Extrahieren von Netzwerkdaten von Hand.
- Horstmann, Jan: forText – Literatur digital erforschen: DraCor: Drama Corpora Project.
- Pozdniakov, Ivan: Shiny Dracor. Framework für interaktive Visualisierungen im Browser.
- Sahle, Patrick, Universität Köln: DHd 2019 Digital Humanities: multimedial & multimodal. Konferenzabstracts.
- Wiki dracor-org/gerdracor