PDFs für die Archivierung durch die DNB entsperren

Im Rahmen des Nestor-Projektes der Deutschen Nationalbibliothek (DNB) sollen Online-Werke archiviert werden. Dazu zählen auch PDFs – auch die mit wissenschaftlichen Inhalten, die auf vielen Open Access-Repositorien schlummern. Sie sollten als PDF/A (in Version 1 oder 2, a oder b) vorliegen und ohne Einschränkungen der Rechte per DRM (eine harmlose Abkürzung für „Digital Restrictions Management“) erstellt worden sein. Doch das ist eher ein Traum denn Wirklichkeit…

Man könnte das Problem der gesperrten Dokumente, die die DNB ohne Schutz von den Betreibern eines Open Access-Repositoriums einfordert, rein technisch betrachten. Die Lösung ist sehr einfach, solange die Dateien als PDF/A-1 und ohne besonders fortgeschrittene PDF-Techniken erstellt worden sind. Dann reicht das Ghostscript-Packet und ein Bash-Script, um alle PDF-Dateien ab dem aktuellen Verzeichnis zu entsperren:

#!/bin/bash
for f in $(find . -type f | egrep ".pdf$");
do 
  echo "Verarbeite jetzt $f";
  cp $f "$f.orig" && gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile="$f" -c .setpdfwrite -f "$f.orig"; 
done;

Doch so einfach ist die Sache nicht. Mit diesem Skript stößt man in die rechtlich dunkelgraue Zone vor. §95a UrhG verbieten die Entsperrung von „technisch wirksamen Schutzmechanismen“ ohne die Zustimmung des Urhebers. Stimmt er dem zu, sind wir rechtlich aus dem Schneider. Tut er es nicht, weil er z.B. nicht mehr auffindbar ist, kann jeder zur Verantwortung gezogen werden, der diese paar Zeilen ausführt.

Seit Januar 2014 wird die Sache dann aber doch mehrdeutig. Wozu darf denn DRM dienen? Nimmt er nicht mehr Rechte als nötig? Damit beschäftigte sich das EuGH im Prozess Aktenzeichen C‑355/12. Die Weisung an die nationalen Gerichte, die solche Klagen zu verhandeln haben, lautet: War es rechtens, das DRM am Werk anzubringen, wenn damit Rechte stärker als unbedingt erforderlich eingeschränkt werden? Es kann sein, dass andere von solchen Schutzmaßnahmen stärker betroffen würden, als es rechtens ist (Konkurrenz „vom Hals halten“ etc). In solchen fällen dürften die nationalen Gerichte die Kopierschutzknacker frei sprechen. Doch dieser Fall ist im Bereich der Langzeitarchivierung noch nie eingetreten und man darf gespannt sein, wie es in Deutschland ausgehen würde…

Update: Der Sachverhalt des EuGH betrifft Verträge (bürgerliches Recht), nicht das Strafrecht. Dennoch hat es für die Betreiber von Repositorien eine bestimmte Wirkung. Eingereichte DRM-geschützte PDF-Dateien verhindern wirksam die Erfüllung der Aufgabe der Langzeitarchivierung, die die meisten Repositorienbetreiber im Veröffentlichungsvertrag als eigene Pflicht definieren. Beträgt diese nur wenige Jahre (5 oder 10), sieht der Vertrag irgendwann diesbezüglich keine Verpflichtung mehr. Man kann eine solche Datei Jahrzehnte lang vorhalten – auch wenn sie wegen des Fehlens entsprechender Software nicht mehr lesbar sein soll. Diese Art der Langzeiterhaltung leistet die DNB, wenn man sie daran nicht hindert. Eine Ablieferungspflicht für DRM-freie PDF-Dateien besteht nicht. Der XMetaDissPlus-Harvester archiviert in solchen Problemfällen ausschließlich die Metadaten.