Handschriften vom Computer entziffern lassen

  • Da hier immer wieder Anfragen zur Entzifferung von alten Handschriften kommen, ein kleiner Tip, welcher sich vielleicht zu probieren lohnt.

    Es gibt von der Universität Innsbruck ein kosteloses Programm namens Transkribus. Das kann angeblich Handschriften recht gut erkennen bzw. kann man das nicht Erkannte ausbessern und das System dadurch trainieren. Es kann auch gedruckte Fraktur erkennen, trainiert nach einem Modell der Österreichischen National-Bibliothek. Auf meinem Mac funktioniert das Programm leider nicht.

  • Dazu gab es ja schon zwei Threads, wer sich informieren mag


    Kurrentschrift mit KI übersetzen


    Erfahrung mit Transkribus?


    Als Ergänzung für lange Texte ist das sicher toll, aber unkritisch empfehlen würde ich es auch nicht. Bei meinen Versuchen hatte das Programm gerade noch Probleme mit Worttrennung und lateinischen Ausdrücken. Wie hier viele Threads beweisen, ist auch die erste Annahme nicht immer die beste und manchmal hilft es eben dann doch, wenn sechs oder mehr Augen nochmal drüberschauen.

    Einmal editiert, zuletzt von Angemeldet ()

  • Danke, die zwei Threads habe ich nicht mitbekommen.

    Diese Art von Programmen funktioniert so, dass sie auf eine Handschrift trainiert werden müssen. Also ähnlich wie beim Menschen, dass man zwar schon etwas Übung mitbringt, aber dann immer mehr an die Handschrift einer Person adaptiert und deren Eigenheiten entziffern kann.

    Wenn das vernetzt geschieht, wie bei den angeführten Projekten, arbeiten mehrere Personen ("Citizen Scientists", Studenten, Historiker) an den Dokumenten nach dem Mehraugenprinzip. Was man nicht entziffern kann, wird als unleserlich markiert, eventuell mit Kommentaren. Irgendwann gibt dann jemand die Seite als als fertig (oder unfertig beendet) frei. Ist eigentlich in England, Neuseeland und Australien sehr verbreitet. Da wurden schon ganze Zeitungsarchive von Freiwilligen nach dem OCR durchkorrigiert. Auch unbearbeitete Aufzeichnungen von Naturforschern ("Field Books", Tagebücher) und die Zettel von Museumssammlungen werden so aufgearbeitet. Ich bewundere das immer, wenn eine neuseeländische Hausfrau hingeschmiertes Gekrixel in deutscher Sprache entziffert.

  • Schade, dass es das hier noch viel zu selten oder nur in den großen Bibliotheken gibt. Eine Vielzahl von Publikationen, angefangen bei den Intelligenzblättern, Verordnungsbüchern und corpora legum vieler kleinerer Städte, die mittlerweile mit OCR-basierter Texterkennung auch in Fraktur zumindest zu 70 oder 80% erkennbar sind, könnten durch solche Projekte viel schneller und effektiver erschlossen werden. Aber der gute deutsche Zentralisierungswahn überlässt die Deutungsmacht, was wichtig ist und was nicht, den großen "Playern", die dann lieber hunderttausende von Euros für fragwürdige Digitalisierungsprojekte verbrennen, weil sie ihrer eigenen Informationsmassen gar nicht anders Herr werden. Dabei stellt eine Bildgebung von Hand- und Druckschriften bestenfalls eine Analogübertragung vion Daten ins Netz dar.


    Wenn sich zwei oder drei Leute finden, die dann so etwas machen, wie du beschreibst und das Ganze dann noch hochladen oder veröffentlichen, werden sie meist als verschrobene Sonderlinge hingestellt, v.a. wenn kein drittmittelbasiertes Förderkolleg dahintersteht. So höre ich es oft von Kollegen, die alle keine Not haben, alte Schriften in die digitale Welt zu übertragen, weil sie eh alles in neueren Büchern finden, was sie brauchen. Daher werden vermutlich auch "Entzifferungs"threads noch in 10 Jahren nicht aus der Mode kommen.