Landeswappen Baden-Württemberg

Aktuelle Hinweise

Ausstellungen

Veranstaltungen

Presse/Berichte

Neue Publikationen

Laufende Projekte

Nachrichtenarchiv

Unser Selbstverständnis

Landesarchiv

Aufgaben und Dienstleistungen

Rechtsgrundlagen

Organisation

Ansprechpartner/innen

Projekte

Jahresberichte

Publikationen

Ausbildung und Praktika

Vergabeverfahren

Stellenausschreibungen

Präsentationen und Inventare

Landeskunde entdecken online (LEO-BW)

Württembergisches Urkundenbuch Online

Auswanderung aus Südwestdeutschland

Klöster in Baden-Württemberg

Landesforschung und Landesbeschreibung

Angebote für Schulen und Gruppen

Mitmachprojekte des Landesarchivs

Aktenaussonderung

Elektronische Systeme

Historischer Wert

Ihr Landesarchiv

Ansprechpartner im Archiv

Übergabeverzeichnisse

Wie nutzen Sie das Landesarchiv?

An welche Archivabteilung können Sie sich wenden?

Mein Konto

Recherche & Bestellung

Recherchehilfen & Dienstbibliotheken

Öffnungszeiten

Rechtsgrundlagen und Formulare

Kopien und Reproduktionen

Landesarchiv >> Projekte >> Digitalisierung von Archiv- und Bibliotheksgut >> OCR-Verfahren

OCR-Verfahren

In einem Probelauf sollen bei der Digitalisierung von Mikrofilmen das Leistungsvermögen und die Grenzen einer automatischen Texterkennung mittels OCR (Optical Character Recognition) und ICR (Intelligent Character Recognition) in Auftragsvergabe an unterschiedliche Dienstleister analysiert werden.

Dabei sieht die Zusammenarbeit mit den Dienstleistern folgendermaßen aus: Die Dienstleister erhalten Testdateien, die von diesen mit Hilfe der automatischen Texterkennung gelesen werden. Zu diesem Zweck werden aus den Warenkörben des Projekts geeignete Archivalien und Bücher zusammengestellt. Bei der Verfilmung wurde bereits auf eine spätere automatische Texterkennung geachtet, indem schwarz/weiß-Vorlagen sowohl mit einem AHU- als auch mit einem Halbtonfilm aufgenommen wurden. Von letzterem wird in bezug auf die Auflösung und Gradation eine bessere Basis für das OCR-Verfahren erwartet.

Zusätzlich werden vom Projektteam eigene Tests durchgeführt. Dabei kommt in erste Linie die OCR-Software Fine Reader 4.0 (ABBYY Software) zum Einsatz.

Die mit OCR erfassten Texte werden auf Vollständigkeit und Darstellungsqualität, Notwendigkeit einer Nachbearbeitung und nicht zuletzt Wirtschaftlichkeit untersucht.

Der automatischen wird eine manuelle Textumsetzung gegenübergestellt und der mit einer händigen Textumsetzung verbundene Aufwand festgehalten.