Nicht nur Text, nicht nur Daten

Das vielleicht erste echte Digital-Humanities-Projekt war die Erstellung des Index Thomisticus durch Robert Busa, das in den 1940er Jahren begann. Mit dieser Konkordanz der Werke von Thomas von Aquin eröffnete Busa ein neues Forschungsgebiet und löste eine Welle der Entwicklung aus, als andere sich daran machten, Textkorpora und die dafür erforderlichen Tools, Algorithmen und Schnittstellen zu entwickeln, mit denen Wissenschafter*innen diese untersuchen können. Seitdem haben Fachleute aus praktisch allen Disziplinen in den letzten Jahren eine erhebliche Erweiterung des Spektrums ihrer Forschung erlebt, die von der digitalen Aufzeichnung kultureller Artefakte bis hin zur abstrakten Modellierung von Informationen reicht.

Im Laufe der Zeit hat sich dies so weit entwickelt, dass es heute die digitale Aufzeichnung praktisch aller „Objekte“ innerhalb der Geisteswissenschaften und ihrer damit verbundenen analytischen Zusammenhänge umfasst: Personen, Orte, materielle Kultur, Konzepte, Kunstwerke und vieles mehr. Doch das Vermächtnis von Busa bleibt bestehen: Trotz der Vielfalt der Ansätze, Ideen, Daten und Methoden in den heutigen Digital Humanities liegt der Schwerpunkt oft nach wie vor auf textzentrierten Projekten und das Vermächtnis dieser Projekte beschränkt sich meist fast ausschließlich auf die von ihnen produzierten Daten. Wir schlagen vor, die Herausforderungen dieser zweiten Expansionswelle als Motto der Konferenz anzugehen: nicht durch den Ausschluss textzentrierter Ansätze, sondern durch deren Einbettung in einen breiteren Kontext, und nicht durch die Missachtung der Bedeutung ihrer Daten, sondern durch die Sicherstellung, dass auch die Methoden, Algorithmen und Transformationen dieser Daten erhalten bleiben, die die neuen Erkenntnisse und das neue Wissen hervorbringen, das wir suchen.

Die Abschottung von Daten und Fachgebieten voneinander kann fruchtbare Forschung behindern. Disziplinen wie Kunstgeschichte und Archäologie produzieren und analysieren traditionell Datensätze zur materiellen Kultur, darunter Klimadaten, Landschaftsprofile und Bildmatrizen. Sie produzieren auch materielle analytische Daten, darunter menschliche biologische Daten wie Genetik und Wahrnehmungsdaten wie Eye-Tracking, EEG, fMRT und so weiter. Diese Daten sind jedoch am hilfreichsten, wenn sie durch die fundierte Integration weiterer Informationen kontextualisiert werden, die ein historisches und kontextuelles Bild vervollständigen, was vielfältige Daten erfordert, die durch die Analyse verschiedener Datensätze gewonnen werden. Die Konferenz zielt darauf ab, eine stärkere Berücksichtigung der Bedeutung vielfältiger Daten für Wissenschafter*innen zu fördern.

Die Datenerstellung ist nicht das Ende, sondern vielmehr der Anfang zeitgenössischer Projekte. Forscher*innen in den Digital Humanities sehen sich heute häufig nicht nur mit der Erstellung von Daten konfrontiert, sondern auch mit der Konzeption und Entwicklung algorithmischer Rahmenwerke für deren Analyse. Sowohl die Daten selbst als auch der gewählte Ansatz sind gleichermaßen wichtig: Daten verlieren oft einen Großteil ihres Wertes, wenn sie von den Methoden ihrer Erstellung und Analyse losgelöst werden. Dieser Aspekt der Wissensproduktion – die Entwicklung von Methoden und deren Ausdruck in Form von Funktionen und Algorithmen – hat hinsichtlich der Nachhaltigkeit und Reproduzierbarkeit in den Digital Humanities bislang noch nicht genügend Beachtung gefunden. Das Fehlen klarer Standards und Best Practices in diesem Bereich bleibt eine grundlegende Herausforderung für die Forschung in den Digital Humanities. Gleiches gilt für die Erhaltung von Schnittstellen und Skripten aller Art. Auch hier ist eine Intensivierung des interdisziplinären Dialogs unerlässlich.

Code und Algorithmen spielen eine ebenso wichtige Rolle für den interdisziplinären Dialog mit anderen Fachbereichen (von der Informatik bis zu den Sozialwissenschaften) wie die wissenschaftliche Prosa. Andere Disziplinen können geisteswissenschaftliche Daten nur verstehen, wenn sie Interpretationen nachvollziehen können, was wiederum davon abhängt, wie diese verarbeitet werden. Daher sind die Entwicklung, Erhaltung und fundierte Diskussion von Code zentrale Bestandteile – wenn nicht sogar Voraussetzungen – für interdisziplinäre, transdisziplinäre und fachübergreifende Zusammenarbeit.

Die Konferenz möchte einen produktiven Raum für Begegnungen und Diskussionen schaffen, um diese Fragen zu erörtern. Panels, Rundtischgespräche, Workshops und Postersessions bringen Expert*innen aus Bereichen der digitalen Kulturerbeforschung, digitalen Archivierung und Datenwissenschaft sowie Vertreter*innen traditioneller, text- und sprachorientierter Digital Humanities zusammen. Wir freuen uns darauf, einen Ort für Diskussionen und Überlegungen zu bieten, um die Forschung voranzutreiben und den Diskurs über Code und Algorithmen, Datenbanken und Archive sowie Text und Daten zu fördern.