Landeswappen Baden-Württemberg

Aktuelle Hinweise

Ausstellungen

Veranstaltungen

Presse/Berichte

Neue Publikationen

Laufende Projekte

Nachrichtenarchiv

Unser Selbstverständnis

Landesarchiv

Aufgaben und Dienstleistungen

Rechtsgrundlagen

Organisation

Ansprechpartner/innen

Projekte

Jahresberichte

Publikationen

Ausbildung und Praktika

Vergabeverfahren

Stellenausschreibungen

Präsentationen und Inventare

Landeskunde entdecken online (LEO-BW)

Württembergisches Urkundenbuch Online

Auswanderung aus Südwestdeutschland

Klöster in Baden-Württemberg

Landesforschung und Landesbeschreibung

Angebote für Schulen und Gruppen

Mitmachprojekte des Landesarchivs

Aktenaussonderung

Elektronische Systeme

Historischer Wert

Ihr Landesarchiv

Ansprechpartner im Archiv

Übergabeverzeichnisse

Wie nutzen Sie das Landesarchiv?

An welche Archivabteilung können Sie sich wenden?

Recherche & Bestellung

Mein Konto

Recherchehilfen & Dienstbibliotheken

Öffnungszeiten

Rechtsgrundlagen und Formulare

Kopien und Reproduktionen

Landesarchiv >> Projekte >> Workflow und Werkzeuge zur digitalen Bereitstellung größerer Mengen von Archivgut >> Projektergebnisse online >> Autorensysteme für die Präsentation von Archivgut im Internet

Autorensysteme für die Präsentation von Archivgut im Internet

Thomas Fricke

Eine ausführliche Darstellung finden Sie bei: Thomas Fricke: Bereitstellung digitalisierter Archivalien im Internet - Beschreibung eines Workflow. In: Kulturgut aus Archiven, Bibliotheken und Museen im Internet. Neue Ansätze und Techniken (Werkhefte der Staatlichen Archivverwaltung Baden-Württemberg). Stuttgart 2004.

Überblick

Im Rahmen des DFG-Projekts wurden Autorensysteme für die Bereitstellung digitalisierter Archivalien im Internet entwickelt, die auch von Personen bedient werden können, die nur über geringe Computerkenntnisse verfügen. Die Autorensysteme bilden sozusagen das Kernstück eines Arbeitsablaufs, der von der datenbankgestützten Grunderfassung eines Archivbestandes bis zur Bereitstellung des zugehörigen Online-Findbuches mit digitalisierten Archivalien reicht. Die Erstellung der Autorensysteme erfolgte analog zu den drei im Projekt entwickelten Präsentationsmodellen: dem Modell für Urkunden, dem Modell für Akten und dem Modell für Zeitungen.

Die Autorensysteme für Akten und Urkunden

Die beiden Autorensysteme für Akten und Urkunden besitzen mehrere Komponenten, die der Datenerfassung dienen. Diese werden vom Autor der Reihe nach durchlaufen. Am Ende der Kette steht ein Bildaufbereitungs-Modul. Die Datenerfassung und -verwaltung wird direkt im Browser durchgeführt. Sie kann also auch dezentral über das Internet oder ein Intranet erfolgen. Für die Bildaufbereitung sind die Bildbearbeitungsprogramme Adobe Photoshop und DeBabelizer erforderlich. Dieser Arbeitsschritt muss also stationär auf einem Windows PC durchgeführt werden.

Die Autorensysteme wurden unter Verwendung der Scriptsprachen PHP, Javascript 1.5 (Document Object Model (DOM)) und VBScript entwickelt. PHP ist eine frei verfügbare Scriptsprache zur Erstellung dynamischer Websites. Die Scripte werden direkt in HTML-Seiten integriert. PHP kann sowohl auf Microsoft- als auch auf Unix-Plattformen verwendet werden. Aufgrund der Include-Funktionalität ist eine übersichtliche Modularisierung der Anwendungen möglich. PHP besitzt einen sehr großen Funktionsumfang, der ständig erweitert wird. Es ist ideal auf die Bedürfnisse der Internet-Programmierung abgestimmt.

Zum großen Erfolg der Programmiersprache PHP hat auch die gute Unterstützung des ebenfalls frei verfügbaren, sehr schnellen Datenbank-Systems MySQL beigetragen, das innerhalb dieses Workflows verwendet wird. JavaScript kann im Gegensatz zu PHP auf dem Computer des Internet-Benutzers vom Browser selbst ausgeführt werden. Somit bildet es eine ideale Ergänzung zu PHP. VBScript, ein BASIC-Derivat, das nur auf der Microsoft-Plattformen genutzt werden kann, wurde lediglich zur Steuerung von Photoshop innerhalb des Windows-Betriebssystems eingesetzt.

Screenshot der Einstiegseite des Autorensystems für Akten mit Auflistung der einzelnen Arbeitsschritte.
Abb. 1: Einstiegseite des Autorensystems für Akten mit Auflistung der einzelnen Arbeitsschritte.

Die Verzeichnung des Bestandes

Und nun zur Darstellung des Gesamtworkflow: Zunächst erfolgt die archivarische Verzeichnung des Gesamt-Bestandes. Die Struktur des Datenmodells baut beim Autorensystem für Akten auf dem Datenmodell von MIDOSA auf. MIDOSA ist ein lizenzfreies, offenes Software-System für die Erstellung von archivischen Findmitteln. Es ist aus einem Verzeichnungsprogramm heraus entstanden, das seit 1983 in den Staatsarchiven Baden-Württembergs eingesetzt wird. Das System wird von der Entwicklungspartnerschaft PARSIFAL aus Landesarchivdirektion Baden-Württemberg, Bundesarchiv und Archivschule Marburg gepflegt und weiterentwickelt. Die archivarischen Titelaufnahmen werden also zunächst mit MIDOSA erfasst. Die Dbase-Daten von MIDOSA werden dann in das Datenbankformat von MySQL konvertiert und in das Autorensystem eingebunden.

Für Urkunden wurde ein eigenes Datenmodell entwickelt. Die Titelaufnahme erfolgte zunächst in einem Microsoft-ACCESS-Formular. Die Daten hätten aber auch direkt mit dem Autorensystem erfasst werden können. Die Konversion von ACCESS nach MySQL ist unproblematisch. Sie erfolgt mit dem leistungsfähigen Zusatzmodul MyAccess, das in der Lage ist, Datentabellen sozusagen auf Knopfdruck aus Microsoft Access direkt in das MySQL-Format zu überführen und gleichzeitig sogar auf den Internet-Server zu übertragen.

Die Erfassung zusätzlicher Metadaten für die Internetpräsentation bei Urkunden

Sobald die Titelaufnahmen erfasst sind und somit der für das Online-Findbuch erforderliche Datenbestand vorhanden ist, können im Autorensystem weitere, für die Präsentation der Digitalisate erforderliche Eintragungen gemacht werden. In beiden Autorensystemen muss das einzelne Archivale zunächst für die Präsentation vorgemerkt werden. Dann wird die Anzahl der physikalischen Seiten des Archivale bzw. der Archivalieneinheit angegeben.

Im Autorensystem für Urkunden können noch weitere Angaben gemacht werden: Sofern auf der Urkunde selbst eine Zählung existiert, wird die Gesamtseitenzahl, die sich aus dieser Zählung ergibt, eingetragen. Literatur zur Urkunde kann angegeben werden. Herkunftsnachweise zu Transkription und Übersetzung sowie eine Beschreibung des Gesamtobjekts können eingefügt werden. Die Inhalte der Titelaufnahmen können kontrolliert und, wenn nötig, aktualisiert werden.

Screenshot der Erfassungsmaske für Titelaufnahmen im Autorensystem für Urkunden.
Abb. 2: Erfassungsmaske für Titelaufnahmen im Autorensystem für Urkunden.

Die Erfassung zusätzlicher Metadaten für die Internetpräsentation bei Akten

Im Autorensystem für Akten wird als nächstes die Binnengliederung der einzelnen Akten erfasst. In einer ersten Eingabemaske sind zunächst nacheinander die einzelnen Gliederungspunkte anzulegen. Jeder Gliederungseintrag erhält einen Titel und die Angabe über die zugehörigen Seiten. Die Anordnung der Gliederungspunkte wird zum einen mithilfe eines Sortierfeldes festgelegt, zum anderen durch Einordnung in eine bestimmte Hierarchie. Die Stufen dieser Hierarchie sind wie bei MIDOSA entsprechend dem so genannten ISAD-G-Modell angelegt. Mithilfe von Codes wird die Position angegeben, auf der sich die jeweilige Verzeichnungseinheit innerhalb der Hierarchie befindet. F0 steht für die gesamte Archivalieneinheit, G0 für einen Vorgang, H0 für ein Dokument und J0 für ein Teildokument.

Ein weiteres Feld ermöglicht eine nähere Beschreibung des Inhalts. Zudem kann eingetragen werden, in welcher Weise das einzelne Dokument oder Teildokument verfilmt werden soll - also farbig oder schwarzweiß, auf Mikrofilm oder Großdia usw.

Screenshot der Erfassungsmaske für Titelaufnahmen im Autorensystem für Akten.
Abb. 3: Erfassungsmaske für Titelaufnahmen im Autorensystem für Akten.

Die Überprüfung der Binnengliederung bei Akten

Wenn alle Gliederungspunkte erfasst sind, wechselt der Autor in eine weitere Maske, die der Überprüfung des Gliederungsaufbaus dient, in der aber nachträglich auch beliebige Änderungen an den Daten vorgenommen werden können. Eine tabellarische Darstellung der Gliederung ermöglicht die genaue Prüfung der Seitenbelegung. Auf einen Blick kann festgestellt werden, ob z.B. eine Dokumenten-Seite fälschlicherweise mehreren Gliederungspunkten zugeordnet wurde oder ob Seiten in der Gliederung gar nicht berücksichtigt wurden. Außerdem wird automatisch überprüft, ob die in der Gliederung vorkommende höchste Seitenzahl die Gesamtseitenanzahl übersteigt, die in der Haupttabelle mit den Titelaufnahmen gemacht wurde.

Von dieser Station des Autorensystems aus kann der Bearbeiter zudem eine tabellarische Übersicht über alle erfassten Akten des Bestandes und deren Untergliederung anwählen. Er kann die erfassten Daten teilweise oder vollständig ausdrucken. Diese Übersicht, in der auch die Angaben über die gewünschte Art der Verfilmung der einzelnen Dokumente mit angezeigt werden, kann dann derjenigen Institution, die die Verfilmung vornimmt, zusammen mit dem Verfilmungsauftrag ausgehändigt werden.

Screenshot der Maske zur Überprüfung der Dokumentengliederung im Autorensystem für Akten.
Abb. 4: Maske zur Überprüfung der Dokumentengliederung im Autorensystem für Akten.

Die Erfassung der Ansicht bei Urkunden

Bei Urkunden gibt es in der Regel keine Binnengliederung, deshalb fällt der zu deren Erfassung dienende Teil im Autorensystem für Urkunden weg. Stattdessen werden Datensätze für die einzelnen Seiten der Archivalieneinheit angelegt. Das Wort Seite ist hier im Sinne von Ansicht gebraucht. Gemeint ist also die Vorder- oder Rückansicht der Archivalien bzw. ihrer einzelnen Komponenten. Urkunden können ja mehrere Blätter umfassen, während Siegel nur eine Vorder-und Rückseite besitzen. Die Seiten der Objekte werden durchnummeriert. Die Seitenzahl bildet dann die Kennziffer mithilfe derer die Verbindung zum Digitalbild hergestellt wird. In dieser Maske kann auch bei jeder Seite eine Originalseitenzahl eingetragen werden, wenn eine solche auf dem Objekt vermerkt ist. Es besteht außerdem die Möglichkeit Zusatztexte einzufügen, die sich auf die einzelnen Seiten beziehen: z.B. eine Transkription, Übersetzung oder Siegelbeschreibungen. Des Weiteren kann die Art der Verfilmung festgelegt werden.

Die Verwaltung, Bildaufbereitung und -zuordnung

Aus bestandserhalterischen Gründen ist es sinnvoll, Archivmaterialien zunächst zu verfilmen und dann vom Film zu scannen. Das Mikrofilm-Material ist sehr lange haltbar. Die Verfilmung dient also auch der Langzeit-Sicherung der Archivalien. Außerdem können von den Filmen bei Bedarf jederzeit Digitalbilder angefertigt werden, ohne dass die Originale erneut belastet werden.

Auch die erstellten Mikroformen und Digitaldatenträger müssen verwaltet werden können. Dafür ist im Autorensystem ein eigener Teil reserviert. Signaturen, und weitere Angaben über Hersteller, Standort und Art der Digitialisate oder Mikroformen können dort eingetragen werden. Wichtig ist gerade bei Digitaldatenträgern das Herstellungsdatum, um später eine rechtzeitige Migration zu ermöglichen.

Ist die Digitalisierung der Archivalien abgeschlossen, so kann mit der Sichtung der Bilder und Festlegung der auf das Einzelbild bezogenen Optionen für die Bildaufbereitung begonnen werden. Dies geschieht ebenfalls im Erfassungsmodul. Festgelegt wird, wie stark die Digitaldaten des einzelnen Bildes reduziert werden können bzw. wie groß ein Objekt im Internet abgebildet werden muss, so dass jedes Detail erkennbar und die Schrift gut lesbar ist, ob ein Bild gedreht werden muss und in wie viele Segmente es aufgeteilt werden soll. Die Großansichten der Objekte sind in den Online-Präsentationsmodulen in Segmente aufgeteilt, um dem Benutzer einen gezielten Zugriff zu ermöglichen und somit die Ladezeiten zu verringern.

Sind die entsprechenden Einstellungen vorgenommen, so wird das einzelne Bild demjenigen Datensatz zugeordnet, der die betreffende physikalische Seite der Archivalieneinheit im Datenbanksystem repräsentiert. Die Zuordnung geschieht durch Umbenennung. Signatur und Seitenzahl werden also im Dateinamen festgehalten. Ebenso die zuvor festgelegten Optionen für die Bildaufbereitung. Im Datensatz der Datenbanktabelle wird vermerkt, das ein Bild vorhanden ist. Durch eine weitere Eintragung in der Datentabelle wird festgehalten, auf welcher Mikroform und auf welchem Datenträger das entsprechende Bild später zu finden ist.

Screenshot der Seitenerfassung, Festlegung der auf das Einzelbild bezogenen Optionen für die Bildaufbereitung und Bildzuordnung im Autorensystem für Urkunden.
Abb. 5: Seitenerfassung, Festlegung der auf das Einzelbild bezogenen Optionen für die Bildaufbereitung und Bildzuordnung im Autorensystem für Urkunden.

Nun werden die Bilder aufbereitet. Die Segmentierung der Bilder für die Großansicht erfolgt mithilfe einer in PHP integrierbaren Grafik-Bibliothek. Im übrigen nutzt das Bildaufbereitungsmodul die Automatisierungsfunktionen der Bildbearbeitungsprogramme Photoshop und DeBabelizer.

In der Praxis wird die Bildaufbereitung am besten paketweise vorgenommen, d.h. Bilder, die in einem Arbeitsablauf erstellt wurden und deshalb gewisse gemeinsame Grundeigenschaften bzgl. Farbtiefe, Tonwertverteilung, Schärfe aufweisen, werden auch in einem Arbeitsablauf aufbereitet. Aus jedem Paket werden zunächst einige Beispiele genommen um festzustellen, welches die geeigneten Aufbereitungsoptionen sind. Hierzu sind Kenntnisse in der digitalen Bildbearbeitung erforderlich. Dann wird das Aufbereitungsmodul und der Batch-Prozess in Photoshop entsprechend konfiguriert. Die auf das einzelne Bild bezogenen Optionen werden bei der Verarbeitung aus dem jeweiligen Dateinamen ausgelesen.

Nachdem die Bilder aufbereitet sind, können sie auf den Server übertragen werden. Die Menge der zu übertragenden Daten beträgt schon bei ca. 250 digitalisierten Urkunden mehrere hundert Mega-Byte. Wichtig sind deshalb eine sichere Serveranbindung mit hoher Übertragungsrate sowie ausreichend Speicherplatz auf dem Server. Die Sicherung der Daten kann z.B. auf DVD erfolgen oder auf Wechselfestplatten. Wenn die Datentabellen nicht bereits auf dem Server verwaltet wurden, müssen diese ebenfalls dorthin übertragen werden.

Zum Schluss wird das Präsentationsmodul konfiguriert. In der Konfigurationsdatei des Präsentationsmoduls werden bestimmte Angaben, die die Datenbankanbindung, den Ablageort der Bilder, die Verlinkung mit Homepage und Beständeübersicht, Ausgabe von Indices und das Layout betreffen, gemacht. Einleitung, Abkürzungsverzeichnis und andere Texte können eingebunden werden. Damit ist der Workflow abgeschlossen.