Forschungsdaten und Datenbanken

Immer häufiger treten beim geisteswissenschaftlichen Arbeiten digitale Daten auf. Hier finden Sie einige Beispiele für Daten, die relevant für die Geisteswissenschaften sind:

  • Sprach- oder literaturwissenschaftliche Korpora
  • Sammlungen von Bildern
  • Wörterbücher und Lexika
  • Bibliografien
  • Datensätze über biografische Daten
  • Antworten auf Fragebogen

Forschungsdaten veröffentlichen

Werden die gewünschten Daten nicht gefunden, kommen die Erhebung und spätere Veröffentlichung der Daten infrage. Die Forschungsdaten werden in der Regel in Repositorien veröffentlicht. Sie treffen als Forschende die Entscheidung, in welchem Repositorium Ihre Forschungsdaten archiviert werden sollen. Wir empfehlen Ihnen folgende Optionen:

  • DARIAH-DE Repository: ein Repositorium für die Geisteswissenschaften, das alle Formate und Datentypen annimmt.
  • TextGrid Repository: ein wichtiges Repositorium für die deutschen Geisteswissenschaften, hauptsächlich für in TEI kodierte Texte.
  • GRO.data: ein generisches Repositorium für den Göttingen Campus.
  • Zenodo: ein generisches Repositorium für alle Fächer und alle Datentypen.

Forschungsdaten und Datenbanken finden

Diese Forschungsdaten können bereits in der Form von Datenbanken oder Datensätzen online vorliegen. Bevor Sie als Forschende die Erhebung von neuen Daten anstreben, lohnt es sich nach bereits existierenden Daten zu suchen. Dafür empfehlen wir zwei Möglichkeiten: das Datenbank-Infosystem (DBIS) und das CLARIN Virtual Language Observatory.

DBIS

DBIS bietet Zugriff auf eine Vielzahl von Datenbanken. Die Datenbanken sind nach Fächern sortiert. Somit können Sie über den Facheinstieg Romanistik zugreifen und unter anderem Fachbibliografien, Volltextdatenbanken und Wörterbücher durchsuchen. Für das Fach Romanistik werden zurzeit circa 120 Titel vorgehalten. Um einen ersten Einstieg zu ermöglichen, wurden einige besonders interessante Optionen bei den „TOP-Datenbanken“ ausgewählt.

DBIS verzeichnet neben kostenpflichtigen Datenbanken, für die die SUB Göttingen Lizenzen erworben hat, auch einige frei im Internet verfügbare Datenressourcen sowie Ressourcen, die deutschlandweit frei zugänglich sind (DFG-geförderte Nationallizenz).

CLARIN Virtual Language Observatory

„Der Facettenbrowser des Virtual Language Observatory (VLO) wurde im Rahmen von CLARIN entwickelt, um die in CLARIN und verwandten Gemeinschaften verfügbaren linguistischen Ressourcen, Dienste und Werkzeuge zu erkunden. Sein Ziel ist es, eine einfach zu bedienende Schnittstelle zu bieten, die einen einheitlichen Such- und Findungsprozess für eine große Anzahl von Ressourcen aus einer Vielzahl von Bereichen und Anbietern ermöglicht.“

Benötigen Sie weitere Hilfe?

Da die Erhebung von Daten für die eigene Arbeit meist von großer Bedeutung ist, empfiehlt sich ein ebenso sorgsamer wie nachhaltiger Umgang damit. Wir empfehlen folgende Links dazu:

  • Göttingen eResearch Alliance (eRA): Speziell für den Göttingen Campus bietet die Göttingen eResearch Alliance (eRA) ein Beratungs- und Serviceangebot rund um das Thema Forschungsdaten.
  • FID Romanistik: Umfangreiche Seite für die Arbeit, Sammlung und Veröffentlichung von Forschungsdaten. Enthalten ist ein Leitfaden für die Veröffentlichung von Forschungsdaten im DARIAH-DE Repository und in Zenodo.
  • Persönliche Beratung: Sie können gerne eine persönliche Beratung mit dem Fachreferenten für Romanistik, Dr. José Calvo Tello (E-Mail), buchen.

Definition von Forschungsdaten

Unter Forschungsdaten versteht man gemäß einer Definition der Deutschen Forschungsgemeinschaft (DFG) in der Ausschreibung „Informationsinfrastrukturen für Forschungsdaten“ (PDF 66,8 KB):

„Unter Forschungsdaten sind im Sinne dieser Fördermaßnahme digitale und elektronisch speicherbare, Daten zu verstehen, die im Zuge eines wissenschaftlichen Vorhabens z.B. durch Quellenforschungen, Experimente, Messungen, Erhebungen oder Befragungen entstehen.“