Alte Handschrift automatisch übersetzen

Gibt es eine Software, die alte deutsche Handschrift übersetzen kann? Das wird sich schon so mancher Ahnenforscher gefragt haben, insbesondere wenn er noch nicht allzu geübt ist im Entziffern von historischen Dokumenten.

Die kurze Antwort auf die Frage lautet: Nein. Ein Programm, das einem Ahnenforscher das Übertragen eines Kirchenbuch-Eintrags in eine lesbare Schrift vollständig abnimmt, existiert nicht – doch es gibt ein extrem hilfreiches Werkzeug, das dank künstlicher Intelligenz eine erstaunliche Hilfe beim Entziffern sein kann, insbesondere bei längeren Dokumenten. Der Haken: Manchmal scheitert auch die KI genau dort, wo Hilfe am dringendsten nötig wäre – oder sie baut Fehler an Stellen ein, die eigentlich gut lesbar sind.

Die Software, die beim Übersetzen alter Handschriften erheblich unterstützen kann, heißt Transkribus. Dabei handelt es sich um ein Programm, das ursprünglich an der Universität Innsbruck entwickelt wurde und inzwischen von der Genossenschaft Read-Coop weitergeführt wird. Die Software arbeitet auf Computern mit Windows, MacOS oder Linux – doch viel bequemer ist es, Transkribus direkt im Browser zu benutzen. Das muss man dazu wissen:

  1. Um Transkribus zu verwenden, ist ein Nutzerkonto nötig. Es gibt eine kostenloses Angebot, das für das gelegentliche Übersetzen eines handschriftlichen Dokuments ausreichend ist.
  2. Ist man angemeldet, erreicht man das Angebot von Transkribus über die Schaltfläche „App öffnen“ am oberen rechten Rand der Internetseite.
  3. Der Start ist – im Vergleich zu früheren Versionen von Transkribus – denkbar einfach: unter der Überschrift „Schnellerkennung“ findet sich ein Fenster, in das man ein handschriftliches Dokument in einer Datei per Drag & Drop ziehen kann. Klickt man auf „Browse“, kann man eine Datei über das Auswahlfenster in einem Ordner anwählen. Möglich ist die Schnellerkennung mit JPG- und PNG-Bildern.
  4. Die Sprache des Dokuments lässt sich auswählen. Dadurch wird automatisch festgelegt, von welchem Modell der künstlichen Intelligenz die Handschrift analysiert und übersetzt wird.
  5. Nach dem Hochladen eines Dokuments zur Schnellerkennung erscheint eine übersichtliche Ansicht, die das Original und eine automatische Übersetzung nebeneinander anzeigt.
Transkription eines Dokuments von 1609 mit der Schnellerkennung in der Browser-Version von Transkribus

Die Qualität der Übersetzungen von Transkribus ist oft gut und nimmt Familienforschern sicherlich viel mühsames Entziffern und Eintippen ab. Es zeigt sich aber auch: Ohne Nacharbeiten geht es nicht. Die Software erkennt immer wieder Buchstaben falsch. Oder es werden Teile des Textes nicht berücksichtigt, weil der Verlauf von Textzeilen nicht korrekt herausgearbeitet wurde. Diese Nacharbeiten kann man in einem Editor erledigen, der über die Schaltfäche „Open in Editor“ unten rechts unter der automatischen Übersetzung zu finden ist.

Ansicht des Editors in der Browser-Version von Transkribus

Regionen ändern

Für die weitere Bearbeitung einer Übersetzung sollte man wissen, dass Transkribus ein Dokument zunächst auf sogenannte Regionen untersucht. Das sind verschiedene Bereiche des Dokuments, die Text enthalten, aber voneinander getrennt betrachtet werden. Im Beispiel oben – einem Sterbeeintrag aus einem Kirchenbuch – wurden die Nummerierung des Sterbeeintrags am linken Rand und der eigentliche Text des Eintrags als unterschiedliche Regionen identifiziert. In der Übersetzung in der rechten Spalte werden sie als „Region 1“ und „Region 2“ aufgeführt.

Allerdings hat Transkribus die Region 1 nicht vollständig erkannt, sodass statt der Zahl 24 nur eine 2 in die Transkription übernommen wurde. In so einem Fall sollte man die Region anpassen. Um eine Region zu ändern, wählt man den „Auswahl-Modus“ in der Werkzeugleiste am linken Rand und klickt die Region an, sodass sie grün hervorgehoben wird. Dann fasst man mit dem Mauszeiger die Punkte am Rand der Region und bewegt sie an die gewünschte Stelle.

Ändern einer Region im Editor der Browser-Version von Transkribus

Zeilen ändern

Auch die Textzeilen, die Transkribus automatisch erstellt, lassen sich im Editor korrigieren. Es kommt immer wieder vor, dass Transkribus zusätzliche Textzeilen erkennt, wie auch im Beispiel oben die Zeilen 1 und 11 in der Region 2. Um sie zu löschen, klickt man mit dem „Auswahl-Modus“ die gewünschte Zeile in der Übersetzung aus. Dann klickt man erneut auf das „Auswahl-Modus“-Werkzeug und drückt die Entfernen-Taste. Die überzählige Zeile ist gelöscht.

Auf ähnlichem Wege lässt sich auch eine zu kurz geratene Zeile wie die Zeile 10 korrigieren: Mit dem „Auswahl-Modus“-Werkzeug die gewünschte Zeile in der Übersetzung anklicken, nochmals auf „Auswahl-Modus“ in der Werkzeugleiste klicken. Jetzt die Umschalttaste (Großschreibtaste) gedrückt halten, sodass ein Auswahl-Rechteck erscheint, das den Verlauf der Zeile markiert. Die Punkte des Rechtecks lassen sich mit dem Mauszeiger greifen, um das Auswahlfeld der Zeile zu ändern.

Ändern einer Zeile im Editor der Browser-Version von Transkribus

Transkription korrigieren

Hat man ein Dokument auf diese Weise korrigiert, kann man einen weiteren Transkriptionsversuch starten. Dazu klickt man auf das Werkzeug „Erkennung“ in der Werkzeugleiste links. Es öffnet sich eine Seite, auf der sich oben rechts die Schaltfläche „Erkennung starten“ befindet. Bevor man eine neuerliche Übersetzung anstößt, kann man hier zudem das gewünschte Modell der künstlichen Intelligenz ändern. Manche der Modelle sind jedoch nur mit einem der kostenpflichtigen Tarife von Transkribus verwendbar.

Das Bearbeiten der Regionen und Zeilen kann bereits das Ergebnis der Transkription verbessern. Gelegentlich macht der Übersetzer allerdings Fehler, sodass man einzelne Wörter von Hand im Editor nachbearbeiten muss. Man kommt also nicht darum herum, ein Dokument nach der Transkription noch einmal Wort für Wort zu prüfen, wenn man eine buchstabengetreue Übersetzung wünscht. Der zeitliche Aufwand dürfte allerdings oftmals geringer sein, als wenn man ein Dokument selbst Wort für Wort entziffern würde.

Händische Korrektur einzelner Wörter in der Übersetzung von Transkribus

Eine präzise Transkription lohnt sich zudem: Wer viele Dokumente in Transkribus bearbeitet und abspeichert, kann über eine Suchfunktion nach Begriffen in allen Texten suchen. Im Suchergebnis wird nicht nur das Dokument genannt, sondern auch die passende Textstelle im Originaltext hervorgehoben.

Tipp: Wer Transkribus ein Dokument im PDF-Format übergeben will, kann das nicht über die oben beschriebene Schnellerkennung machen. Stattdessen muss man zunächst eine sogenannte Sammlung („Collection“) anlegen. Das ist eine Art Ordner, in den neben JPG- und PNG-Dateien eben auch PDF-Dokumente hochgeladen werden können.





Zuletzt geändert am

2 Kommentare

  1. Ich habe mich mit dem Programm ziehmlich intensiv beschäftigt. Bin der Meinung, dass es sich für die Ahnenforschung nur bedingt eignet. Die Bedienung ist sehr. gewöhnungsbedürftige und nicht zeitgemäß. Das Ergebnis war bei meinen Versuchen unbefriedigend. Resümee: Der Zeitaufwand für einzelne Dokumente ist zu groß. Insbesondere im Hinblick auf die unbedingt notwendige Nacharbeit der Transkription. 👎

  2. Mittlerweile arbeitet die KI sehr gut und es müssen nur noch wenige Fehler nachgearbeitet werden. Offensichtlich wird es täglich von vielen Forschern benutzt. und es entstehen geringe Wartezeiten.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert