Jeder fängt mal vorsichtig an. Die Deutsche Nationalbibliothek hat mittlerweile nicht nur den Auftrag, gedruckte Tageszeitungen zu sammeln. Sie ist auch beauftragt, digitale Tageszeitungen zu archivieren. Doch da dafür noch die richtigen Instrumente fehlen, sammelt man erst einmal das Einfachste ein: die E-Paper der Tageszeitungen.
Und so vermeldet die Deutsche Nationalbibliothek, dass in ihren Lesesälen mittlerweile mehr als 1,5 Millionen Seiten digitaler Tageszeitungen zur Verfügung stehen. Die rund 36.500 Ausgaben deutscher E-Paper-Titel können an ausgewiesenen Arbeitsplätzen in Leipzig und Frankfurt, den Standorten der Deutschen Nationalbibliothek, gelesen werden. Und jeden Tag werden es mehr: Von rund 300 E-Paper-Titeln sammelt die Bibliothek täglich die aktuelle Ausgabe ein. So kommen von Montag bis Samstag rund 1.800 neue Ausgaben ins Haus, sowie wöchentlich die Ausgaben von 16 Sonntagszeitungen.
Zunehmend vertreiben die Zeitungsverlage nicht nur gedruckte Tageszeitungen, sondern stellen zusätzlich layoutgetreue digitale Ausgaben - so genannte E-Paper - für ihre Abonnenten ins Internet. Durch die Sammlung der E-Paper hat sich das Angebot für die Benutzerinnen und Benutzer vor Ort in Leipzig und Frankfurt am Main deutlich verbessert: Sie können nun einzelne E-Paper-Ausgaben gezielt suchen und unmittelbar aus dem Katalog heraus per Mausklick aufrufen. Schon eine Woche nach Erscheinen der digitalen Ausgabe kann sie in den Lesesälen genutzt werden.
Gegenüber der früheren Bereitstellung der Tageszeitungen auf Mikrofilm, die drei bis vier Monate Bearbeitungszeit benötigte, sei das eine deutliche Verbesserung des Service, so die DNB. Für externe Nutzer könne der Service aus urheberrechtlichen Gründen nicht angeboten werden. Und ebenfalls aus urheberrechtlichen Gründen sei es nicht möglich, ein E-Paper oder auch nur Teile daraus abzuspeichern und in digitaler Form mit nach Hause zu nehmen.
Um die großen Mengen bewältigen zu können, hat die Deutsche Nationalbibliothek zusammen mit einem Dienstleister, der iSquare GmbH in Berlin, einen vollautomatischen Arbeitsfluss (workflow) entwickelt. Auf dessen Basis werden die E-Paper-Ausgaben von den Verlagsservern "geharvestet", so teilt die Deutsche Nastionalbibliothek mit.
Es darf an dieser Stelle ganz laut geschrien werden.
"Harvesten" heißt zu gut deutsch ganz einfach einsammeln. Aber wie das so ist mit dem denglischen Kauderwelsch: Es entsteht einfach, weil Übersetzer von Fachtexten zu faul sind, deutsche Entsprechungen für scheinbar eindrucksvolle Vorgänge in englischen Texten zu suchen.
Die eingesammelten E-Zeitungen (E-Paper) werden dann in ein einheitliches Format konvertiert (umgewandelt). Dafür wurde das Format PDF/A-1b gewählt, um optimale Voraussetzungen für die Langzeitarchivierung zu schaffen. Anschließend spielt die Deutsche Nationalbibliothek die Daten in ihre Systeme ein, legt die E-Paper-Ausgaben auf ihrem Archivserver ab und verzeichnet sie automatisch in ihrem Katalog, so dass sie für die Benutzung im Lesesaal zur Verfügung stehen.
Was die Deutsche Nationalbibliothek noch nicht geschafft hat, deren Aufgabe es ja ist, alle Publikationen mit Bezug zu Deutschland ab 1913 zu sammeln, dauerhaft zu archivieren, umfassend zu dokumentieren und bibliografisch zu verzeichnen sowie der Öffentlichkeit zugänglich zu machen, ist die Archivierung von Online-Publikationen, die nicht als E-Paper angeboten werden.
Das ist seit der Novellierung des Gesetzes über die Deutsche Nationalbibliothek aus dem Jahr 2006 ebenfalls ihre Aufgabe - sogenannte Netz-, oder Onlinepublikationen zu zu sammeln. Doch wie macht man das, wenn es keine Pflichtexemplare gibt, die an die Bibliothek abgeliefert werden, weil das Medium permanent im Fluss ist? - Vielleicht sollte man sie nicht harvesten, sondern streamen?
www.dnb.de