Post empfehlen

Das Drama Corpora Project

DraCor ist eine kostenlose, webbasierte, offene Plattform zur Dramenforschung. DraCor transformiert vorliegende Textsammlungen in programmierbare Korpora. Es stehen sechs verschiedene Dramenkorpora zur Verfügung mit Texten, die zwischen 1730 und 1930 erschienen.

DraCor generiert automatisch Figuren-Netzwerke und stellt verschiedene Textuntermengen bereit wie den gesprochenen Text einer Figur, die Regieanweisungen oder die Texte der weiblichen bzw. männlichen Figuren.

DraCor enthält 473 deutschsprachige, 163 russische und zudem griechische, römische, spanische und viele Shakespeare Dramen. Den deutschen Texten liegt das TextGrid Repository zugrunde.

DraCor wird herausgegeben von der Universität Potsdam und vom Centre for Digital Humanities an der HSE Moskau. Das Korpus steht unter der Lizenz CC0 (no rights reserved).

Die Daten können in verschiedenen Formaten exportiert und weiterbearbeitet werden als TXT-, RDF-, CSV-, GEXF- oder JSON-Dateien. Es ist keine Registrierung notwendig.

Distant Reading und Digital Humanities

Im Post Digital Humanities und Distant Reading habe ich in die Grundidee der quantitativen Textanalyse eingeführt und im Post Distant Reading mit Voyant eine Analyselandschaft vorgestellt.

Unter dem Begriff Digital Humanities werden “Neuerungen in den Geisteswissenschaften zusammengefasst, die auf der gezielten Anwendung digitaler Forschungsressourcen beruhen.” (sagw) Typische Arbeits- und Forschungsfelder sind digitale Editionen, Visualisierungen komplexer Datenstrukturen und die quantitative Textanalyse.

Distant Reading ermöglicht es, mit Hilfe computergestützter Verfahren ganze Korpora zu lesen und zu visualisieren. Durch Abstraktion werden aus Theaterstücken Netzwerke. Handlungen bestehen aus Figuren und Aktionen, ein Netzwerk aus Knoten und Kanten. Mit der Plattform DraCor lassen sich solche Netzwerke einfach erstellen. Bei den folgenden Ausführungen stütze ich mich auf Jan Horstmanns Artikel DraCor: Drama Corpora Project.

Fragestellungen im Unterricht

DraCor wird vor allem für wissenschaftliches Arbeiten genutzt, kann aber auch im Unterricht eingesetzt werden. Das Hauptziel von DraCor ist es, “einen Ausgangspunkt für verschiedene digitale Projekte bereitzustellen”, für die man sich die Daten herunterladen kann. (forText) Die exportierten Daten können z.B. mit Voyant oder Gephi weiterverarbeitet werden.

Mögliche DraCor-Fragestellungen zu Wedekinds “Frühlingserwachen”sind beispielsweise:

  • Wie sieht die Personenkonstellation des Dramas aus?
  • Welche Figuren treten im Akt II von “Frühlings Erwachen” gemeinsam auf?
  • Wie hoch ist der Anteil Wendlas am gesprochenen Text?
  • Wie sieht in Bezug auf den gesprochenen Text das Verhältnis weiblicher und männlicher Figuren aus?
  • Ist der Anteil der Regieanweisungen in diesem naturalistischen Drama tatsächlich höher als in einem Drama einer anderen Epoche?

Textsuche und ein Netzwerk erstellen

So laden Sie Frank Wedekinds Text “Frühlings Erwachen” und generieren daraus eine Personenkonstellation:

  • Starten Sie auf https://www.dracor.org/ und klicken Sie auf “German Drama Corpus”.
  • Das Korpus kann nach Autor*in, Titel, Netzwerkgrösse, Erscheinungsjahr und Textquelle gefiltert werden.
  • Suchen Sie nach “Wedekind”.
DraCor: German Drama Corpus: F. Wedekind “Frühlings Erwachen”
  • Wählen Sie das Drama “Frühlings Erwachen” aus und zoomen Sie dann in das Netzwerk hinein.
  • Im Reiter “Network” wird die Personenkonstellation präsentiert:
DraCor: Network zu “Frühlings Erwachen”
  • “Speech distribution” bietet zwei Visualisierungen an:
    • Im linken Diagramm die Szenennummern mit der Anzahl Charaktere pro Szene.
DraCor: Speech distribution zu “Frühlings Erwachen”
number of characters in number of scene
  • Im rechten Diagramm wird die Häufigkeit der Szenen mit einem, zwei bis n Charakteren pro Szene visualisiert:
DraCor: Speech distribution zu “Frühlings Erwachen”
number of characters per scene

Im Bereich “Metrics” werden statistische Angaben bereitgestellt. Diese Netzwerkdaten kann man als CSV- oder als GEXF-Dateien herunterladen.

DraCor: Speech distribution zu “Frühlings Erwachen” Metrics
  • Die Personenliste “Cast list” ist nach der Chronologie des Auftretens der Personen im Drama geordnet:
DraCor: Speech distribution: “Frühlings Erwachen” Cast list

DraCor API – Download von Netzwerkdaten

Eine API bietet verschiedenartige Metadaten an:

  • strukturelle Daten zu Akten, Szenen, Regieanweisungen und Seitenumbrüche zur Orientierung im Text
  • semantische Daten wie das Geschlecht der Figuren
  • weitere Daten wie Autor, Erscheinungsdatum, Veröffentlichung, Premiere des Stücks, Figurennamen, Links zur Textquelle

Klickt man auf den Link “API” und dann auf “public”, können Einzeltexte, Textteile und Metadaten exportiert werden:

DraCor: API mit Metadaten
  • Personenlisten
  • der gesprochene Text (ohne die Bühnenanweisungen) mit der Möglichkeit, diesen nach dem Geschlecht zu filtern
  • der gesprochene Text einzelner Figuren
  • die Bühnenanweisungen
  • Weitere Daten: Listen mit allen verfügbaren Korpora, mit dem Inhalt eines Korpus, mit den Metadaten aller Dramen eines Korpus, mit den Metadaten und den “network metrics” oder ein TEI- oder ein RDF-Dokument eines einzelnen Dramas. Zudem kann man die Netzwerkdaten eines Dramas im CSV- oder im GEXF-Format (für die Weiterverarbeitung mit Gephi) herunterladen.

Erstellen einer Personenliste

DraCor – Personenverzeichnis
  • In der API kann man im Bereich public /corpora/{corpusname}/play/{playname}/cast eine Personenliste des Dramas erzeugen lassen.
    • Dazu klickt man vor der Funktion auf “Get” und dann auf “Try it out”.
    • Jetzt gibt man im Feld “corpusname” den Korpusnamen “ger” ein und im Feld “play name” den Titel des Dramas “wedekind-fruehlings-erwachen”. Die Syntax des Werknamens findet man im Link, der zu dem Drama führt.
    • Mit “Execute” wird die Personenliste generiert.
  • Im Feld “Request Url” erhält man einen Link, mit man das Resultat speichern oder teilen kann, im Bereich “Response body” steht die Personenliste als Download bereit:
DraCor – List of characters

Genderspezifisches Filtern

Möchte man nur den gesprochenen Text der weiblichen Figuren exportieren, geht man z.B. wie folgt vor:

  • Man wählt “Get spoken text of a play (excluding stage direxctions)”.
  • Dann klickt man auf “Get” und schliesslich auf “Try it out”.
  • Dann füllt man die Suchmaske aus und wählt bei “gender” “FEMALE”.
  • Mit “Execute” wird die Liste bereitgestellt.

DraCor – Export des Texts der weiblichen Figuren

Eigene Netzwerke aufbauen

Für dramatische Texte, etwa Dramenfragmente wie Büchners “Woyzeck”, die in DraCor nicht verfügbar sind, kann man mit Ezlinavis selbst ein Netzwerk aufbauen. Wie das gemacht wird, erkläre ich in meinem nächsten Post.

Links

Diese Posts könnten Sie auch interessieren

Dramenanalyse mit DraCor

Post empfehlen
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.