«Wenn ich dieses Tool nur schon früher gehabt hätte!»
Mit einem neuen Datenexport aus dem Metakatalog swisscollections macht die Zentralbibliothek Zürich (ZB) gemeinsam mit anderen Bibliotheken einen Schritt in Richtung Open Science. Mit dem neuen Export können grosse Mengen von Bildern und Volltexten direkt aus swisscollections herunterladen werden. Ein Klick genügt und die Trefferliste landet als zip-Ordner in den Downloads. Dies macht die Nutzung von Bibliotheksdaten zum Beispiel für KI-Projekte viel einfacher.

Seit dem 1. Oktober 2024 können auf swisscollections digitalisierte Sammlungen nicht nur entdeckt und durchsucht, sondern auch als Datenpaket bezogen werden. Der neue Datenexport stellt zu einer Trefferliste Metadaten in verschiedenen Formaten wie JSON und CSV bereit.
Ausserdem können Bild- und Textsammlungen bequem herunterladen werden, um sie z.B. für ein Forschungsprojekt zu nutzen. Das ist einzigartig und erleichtert die Arbeit der Forschenden enorm. Statt mit viel Aufwand selbst kleine Programme zu schreiben, die Daten aus den Rechercheplattformen auslesen, können die gewünschten Daten nun mit wenigen Klicks heruntergeladen werden. Die Metadaten im CSV-Format erlauben es zudem, ein Datenset weiter zu verfeinern.
Erwartungen an Bibliotheksservices im Wandel
Die Digitalisierung hat die Gewohnheiten und Erwartungen der Nutzenden verändert. Sie sind es gewohnt, dass fast alles online verfügbar ist. Dies gilt auch für die Wissenschaft: Forschende erwarten, dass sie ihre Forschungsobjekte als Daten erhalten können: Volltexte, digitalisierte Sammlungen, Transkriptionen, audiovisuelle Medien und 3D-Modelle. Hochwertige Metadaten sind dabei unerlässlich.
Der neue Datendownload ist einzigartig und erleichtert die Arbeit der Forschenden enorm.
Verbesserter Datenzugriff durch das ZB-Lab
Das ZB-Lab arbeitet seit November 2020 daran, den Zugriff auf die Daten der ZB zu verbessern. Dabei geht es beispielsweise um die Frage, wie die ZB einer Doktorandin den Volltext aus 400 Romanen zur Verfügung stellen kann.
Hochwertige Metadaten, wie sie auf dem Bibliothekskatalog swisscovery durchsucht werden können, sind für Forschende entscheidend. In Interviews hat das ZB-Lab Anforderungen von Digital Humanities-Forschenden an Bibliotheksservices zusammengetragen: Forschende möchten ihr Datenkorpus gezielt eingrenzen können, z.B. auf japanische Holzschnittdrucke oder auf Romane um 1900 von Schweizer Autor*innen. Hochwertige Metadaten, wie sie auf swisscovery durchsucht werden können, sind dafür entscheidend. So ist die Idee entstanden, den Download-Service in den Bibliothekskatalog zu integrieren, anstatt einen separaten Service mit eigener Suche aufzubauen.
Rechtliche Herausforderungen
Aus rechtlichen Gründen bleibt es trotz Fortschritten im Bereich Open Access schwierig, Massendownloads für zeitgenössische e-Medien anzubieten. Anders ist es bei digitalisierten historischen Beständen, die unter einer freien Lizenz verfügbar sind. In einem Vorprojekt mit dem Arbeitstitel OneAPI (etwa «die eine Schnittstelle») hat das ZB-Lab 2022 untersucht, wie die ZB diese Bestände als flexibel zusammenstellbare Bild- und Textkorpora anbieten könnte. Bald wurde klar, dass der geeignete Datenausschnitt die auf e-rara und e-manuscripta veröffentlichten Digitalisate sind. Sie sind unter einer offenen Lizenz verfügbar. Ausserdem verfügen e-manuscripta und e-rara über die nötigen Schnittstellen, um die Daten für einen Massendownload von Bildern und Texten aufzubereiten.
Tassilo Roeck, Historiker und Kurator der Multimedia-Ausstellungen Rhyality, sagt zum neuen Download: «Dieses Tool hätte mir eine ganze Menge Zeit erspart.»
Kooperation für bessere Services
Die Entwicklung eines Datenservices macht nur im Verbund mehrerer Institutionen Sinn: Die Daten sind ja bereits auf institutionsübergreifenden Plattformen publiziert. So hat das ZB-Lab seine Idee dem Verein swisscollections präsentiert, der den gleichnamigen Metakatalog betreibt. Der Verein zeigte grosses Interesse und beauftragte seine technische Partnerin, die Universitätsbibliothek Basel, sowie das ZB-Lab mit der Realisierung. So entstand eine fruchtbare Kooperation. Das ZB-Lab teilt mit Stolz mit: Der neue Datenservice ist da! Es ist nun möglich, eine swisscollections-Trefferliste als Datenpaket zu exportieren.
Anwendungsbeispiele und Ausblick
Der Historiker Tassilo Roeck kuratiert Multimedia-Ausstellungen in der Rhyality Immersive Art Hall in Neuhausen am Rheinfall. Dafür lädt er jeweils hunderte Bilder von e-manuscripta und e-rara herunter. Als das ZB-Lab ihm den Datenexport zeigte, meinte er: «Dieses Tool hätte mir eine ganze Menge Zeit erspart – wenn ich es nur schon früher gehabt hätte!».
Auch in der Kunstgeschichte könnte die neue Funktion auf grosses Interesse stossen. So wäre es beispielsweise möglich, auf einen Schlag hunderte von Holzschnittdrucken aus dem 16. Jahrhundert herunterzuladen und zu vergleichen.

Künftig werden immer mehr Forschende die massenweise heruntergeladenen Daten mit digitalen Methoden analysieren. Mark Ittensohn, Produktportfoliomanager an der ZB, befasst sich z.B. mit Machine Learning und Computer Vision. Er musste bisher viel Aufwand in den Download der Bilder stecken. Nun kann er sich ganz auf die Bildanalyse konzentrieren.
Das gezielte Sammeln von Daten ist ein wichtiger Schritt für viele Forschungsvorhaben. In der Linguistik wurde der Wunsch einer Datenbibliothek schon vor einigen Jahren artikuliert. So formulierten die Computerlinguisten Noah Bubenhofer und Klaus Rothenhäusler im Jahr 2016 ihre Wünsche an Bibliotheken:
Die Bibliotheken müssen ihre Bestände im Volltext, nicht nur deren Metadaten digital verfügbar machen, so dass mit computergestützten Verfahren darauf Forschung betrieben werden kann. Im Vergleich zu anderen (kommerziellen) Angeboten wären Bibliotheken in der Lage, über ihre Metadatenspeicher einen wissenschaftlichen Mehrwert zu diesen Rohdaten zu liefern […]. Sie wären also nicht nur Bibliothek, sondern auch «Korporathek». (1)
Der swisscollections-Datenexport kann als Schritt in Richtung Open Science verstanden werden. Bibliotheken beginnen, ihre Speicher für digitale Nutzungsformen zu öffnen. (2) Wir hoffen, dass der neue Datenservice die Bibliotheks-Community dazu anregt, weitere Datenangebote auf- und auszubauen.
Den neuen Datenexport ausprobieren kann man auf swisscollections.ch. In einer Dokumentation sind weitere Informationen zugänglich.
Annabelle Wiegart / Elias Kreyenbühl
ZB-Lab
Literatur:
(1) Bubenhofer, N., & Rothenhäusler, K. (2016). «Korporatheken»: Die digitale und verdatete Bibliothek. 027.7 zeitschrift für bibliothekskultur, 4(2), 60–71, https://doi.org/10.5281/zenodo.4705307, S. 69.
(2) Max Kaiser stellt den Weg dar, auf dem sich die ÖNB auf die digitalen Nutzungsformen vorbereitet: Kaiser, M. (2023). «Digitale Sammlungen als offene Daten für die Forschung». In «Bibliothek Forschung und Praxis,» Bd. 47Bd. 7/2, S. 200-212, https://doi.org/10.1515/bfp-2023-0021. 200-212.