Landeswappen Baden-Württemberg

Aktuelle Hinweise

Ausstellungen

Veranstaltungen

Presse/Berichte

Neue Publikationen

Laufende Projekte

Nachrichtenarchiv

Unser Selbstverständnis

Landesarchiv

Aufgaben und Dienstleistungen

Rechtsgrundlagen

Organisation

Ansprechpartner/innen

Projekte

Jahresberichte

Publikationen

Ausbildung

Vergabeverfahren

Stellenausschreibungen

Wie nutzen Sie das Landesarchiv?

Was finden Sie wo?

Erste Zugänge

Angebote für Schulen und Gruppen

Nutzung gesperrter Archivalien

Arbeitshilfen und Dienstbibliotheken

Rechtsgrundlagen und Formulare

Öffnungszeiten

Präsentationen und Inventare

Württembergisches Urkundenbuch Online

Auswanderung aus Südwestdeutschland

Klöster in Baden-Württemberg

Landesforschung und Landesbeschreibung

Quellen und Themen für den Unterricht

Aktenaussonderung

Elektronische Systeme

Historischer Wert

Ihr Landesarchiv

Ansprechpartner im Archiv

Rechtsgrundlagen

Übergabeverzeichnisse

Landesarchiv >> Projekte >> Digitalisierung von Archiv- und Bibliotheksgut >> OCR-Verfahren

OCR-Verfahren

In einem Probelauf sollen bei der Digitalisierung von Mikrofilmen das Leistungsvermögen und die Grenzen einer automatischen Texterkennung mittels OCR (Optical Character Recognition) und ICR (Intelligent Character Recognition) in Auftragsvergabe an unterschiedliche Dienstleister analysiert werden.

Dabei sieht die Zusammenarbeit mit den Dienstleistern folgendermaßen aus: Die Dienstleister erhalten Testdateien, die von diesen mit Hilfe der automatischen Texterkennung gelesen werden. Zu diesem Zweck werden aus den Warenkörben des Projekts geeignete Archivalien und Bücher zusammengestellt. Bei der Verfilmung wurde bereits auf eine spätere automatische Texterkennung geachtet, indem schwarz/weiß-Vorlagen sowohl mit einem AHU- als auch mit einem Halbtonfilm aufgenommen wurden. Von letzterem wird in bezug auf die Auflösung und Gradation eine bessere Basis für das OCR-Verfahren erwartet.

Zusätzlich werden vom Projektteam eigene Tests durchgeführt. Dabei kommt in erste Linie die OCR-Software Fine Reader 4.0 (ABBYY Software) zum Einsatz.

Die mit OCR erfassten Texte werden auf Vollständigkeit und Darstellungsqualität, Notwendigkeit einer Nachbearbeitung und nicht zuletzt Wirtschaftlichkeit untersucht.

Der automatischen wird eine manuelle Textumsetzung gegenübergestellt und der mit einer händigen Textumsetzung verbundene Aufwand festgehalten.