OCR Frakturerkennung

  • mit der App vFlat kostenlos und in Superqualität - von einer koreanischen Software unerwartet - die Texterkennung von Frakturtexten durchführen kann

    von der App vFlat so begeistert, weil man dort die Seiten schlichtweg abfotografieren kann und die Wellung der Buchseite durch die App korrigiert wird. Hinzu kommt dann noch die kostenfreie und sehr gute Texterkennung.

    Allerdings fehlt mir eine gute Beschreibung der Funktionen, ich kann den Texterkennungsvorgang jeweils für jede Einzelseite duchführen. Vielleicht gibt es dazu eine von mir noch nchht entdeckte Möglichkeit. Deshalb kopiere ich die so erfassten Seiten dann doch auf den PC und nutze dann Abbyy Finereader 16 zur Texterkennung.


    Ob diese neueste Abbyy-Version die Erkennung von Frakturschrift verbessert hat, kann ich nicht feststellen. Allerdings ist die Fehlerkorrektur deutlich einfacher als in der Vorversion.

    In der Tat eine interessante Dokumentenfotografier- und OCR-App abseits der bekannten Anbieter, habe sie probiert. OCR scheint allerdings nicht (mehr?) grenzenlos kostenlos zu sein, zumindest in meiner Installation wird "Text recognition credit 100 pages" angezeigt. Bei antippen steht "daily free credit", also 100 Seiten am Tag sind gratis und bezüglich mehr "credits" gibt es die Option Werbung anzuschauen (10 credits) oder dafür zu bezahlen (funktioniert bei mir derzeit nicht).

    Die App ist jedenfalls interessant für optimierte Dokumentenabfotografie, falls die Standard-Cam das nicht bietet. Die Anx-Cam in Xiaomi-MIUI (siehe auch Port für Custom-ROMs) bietet das z.B. und funktioniert recht gut. Samsung bietet da leider anscheinend (zumindest in der vorletzten Galaxy-Generation) nichts. Google Lens (auf Pixel) wäre vom Ansatz her interessant, aber reine Text-OCR kann auch die Libre-FOSS "OCR" (siehe F-Droid) basierend auf Tesseract. Privacy (=lokale Offlineverarbeitung), zumindest bei Umgang mit nicht so alten Dokumenten, ist für mich auch relevant. Als Resultat ist in meinem Fall sowohl eine optimierte Abfotografie ("Scan") des Buches/Dokumentes, als auch ein hOCR-PDF interessant. Zumindest habe ich noch kein anderes leicht durchsuchbares/kompatibles Dateiformat gefunden.
    Deshalb scheint auch bei mir der Weg
    1) optimerte Abfotografie am Smartphone
    2) Kopie zum PC und Anwendung hOCR-PDF-Software
    derzeit die beste Lösung.
    Bezüglich Abbyy Finereader 16 einfachere Fehlerkorrektur: ich kenne bzw. habe Möglichkeit die Version 15 zu nutzen. Die Frage ist ob es große Unterschiede gibt, bzw. Adobe Acrobat (Version ?) hier mit neuester Variante einen Vorteil bietet.
    Das Problem ist, man müsste immer die aktuellsten Vollversionen für den eigenen Use-Case gut und umfangreich durchtesten, um hier eine valide Entscheidung zu treffen, oder halt das momentan erzielbare Resultat als ausreichend zu akzeptieren.


    EDIT: Auf einen Hinweis hin habe ich die Microsoft Lens App ausprobiert. Überraschenderweise funktioniert die App auch ohne MS-Login und sogar offline. Nach Auswahl der Option wird ein hOCR-PDF erzeugt. Andere Optionen sind das Speichern der Scan-Fotografie in der Galerie und über MS-Login Konvertierung nach Word, PowerPoint, OneDrive, OneNote.
    Die Bildoptimierung vor OCR scheint nicht so ausgeklügelt (oder KI-unterstützt) zu sein wie anderswo, aber die Offline-OCR ist sicherlich sehr gut für Android-Apps laut meinen Vergleichen. Die Mängel, die mir nach einem kurzen Test aufgefallen sind, sind fehlende Leerzeichen und das Nichterkennen von Listen/Tabellen. Basierend auf App-Bewertungen scheint die Dokumenten-/Bucherstellung auf 100 Seiten begrenzt zu sein, ich bin mir nicht sicher, ob es aus Leistungs- oder anderen Gründen so ist, aber ich denke, es ist in Ordnung.
    Vielleicht ist "scannen" mit Anx-Cam oder vFlat und dann OCR des Bildes mit MS Lens ein guter Prozess auf dem Smartphone, dass muss ich noch ausprobieren. Bei großen Projekten ist es sicherlich am besten, OCR auf einem PC durchzuführen.

    3 Mal editiert, zuletzt von ChrisR ()

  • Ich habe Finereader 16 als Update für unter 50 Euro erworben.

    Bei der Vorversion konnte die Korrektur eines Buchstaben in zwei Buchstaben nicht erfolgen, also aus einem m kein nr machen, weil das Programm in der Vorversion auch den Folgebuchstaben löschte.

  • Anlässlich der Veröffentlichung von gImageReader-3.4.1

    habe ich mein Netzwerk bemüht und einen kleinen Vergleich gemacht


    Bewertung OCR Abfotografie linke Buchseite Serif Text mit schrägen “gebogenen” Zeilen (nicht optimal Ob. S. 20)

    ABBYY FineReader v15.0.114 Sehr gute Erkennung der Zeilen/Absätze/Struktur. Fehlerkorrektur einzelner Zeichen empfohlen (ca. 2-10 pro Seite)

    Adobe Acrobat Pro DC 2022.003 Schrägste Zeilen an den Rändern bzw. Wörter/Zeichen teils nicht erkannt. Dadurch einiges an Inhalt ev. manuell zu korrigieren/einzufügen. Einzelzeichen-Fehlerkorrektur/Häufigkeit nicht getestet.

    gImageReader-3.4.1 Schrägste Zeilen an den Rändern werden zwar fast komplett erkannt, aber sehr schlechte Erkennung der Zeilen bzw. falsche Aneinanderreihung des Textverlaufes und sehr häufige Auslassung von Leerzeichen.


    Bewertung OCR Fraktur bei nicht perfekter Abfotographie (Adressverz. 1828), akzeptabel horizontal

    ABBYY FineReader v15.0.114 Das Programm erlaubt nur die Sprache (Deutsch) auszuwählen aber keinen Schriftschnitt bzw. nicht Fraktur. Währen Struktur/Zeilen gut erkannt werden, ist die Erkennungsrate schlecht (auch im Verhältnis zu gImageReader) und so nicht brauchbar.

    Adobe Acrobat Pro DC 2022.003 Das Programm erlaubt nur die Sprache (Deutsch) auszuwählen aber keinen Schriftschnitt bzw. nicht Fraktur. Währen Struktur/Zeilen gut erkannt werden, ist die Erkennungsrate schlecht (noch schlechter als FineReader) und keinesfalls brauchbar.

    gImageReader-3.4.1 Es werden nach Auswahl von Fraktur [Skript] nur Teile der Seite und teils mit häufigen Fehlern erkannt. Nur teils brauchbar bzw. vielleicht bei perfekten Scans (Horizontal/Schärfe).


    Interessehalber habe ich auch die hier vorher erwähnten Android Apps bezüglich der Frakturseiten-abfotografie gestestet (gleiche JPG Datei verwendet).

    MS Lens 16.0.15726 (offline) die Erkennung Struktur/Zeilen ist gut, bei den Zeichen ok, erstaunlich besser als FineReader aber nicht so gut wie gImageReader.

    vFlat 0.10.17.230214 (Offline) Es schien nur ein Bild erkannt zu werden. Bei Onlinegang funktioniert die Erkennung und zwar wohl am Besten (besser als

    gImageReader) aber es bräuchte doch auch eine Fehlerkorrektur pro Seite, die am Smartphone nicht (oder schwierig) möglich ist. Also zuwenig gut um es produktiv zu gebrauchen. Bei Verwendung perfekter Scans könnte diese App eine Option sein, falls sie s usw. durchgängig gut erkennt.

    Diese Smartphone-Apps erachte ich aber nur bei Umwandlung in hOCR von bis zu 10-20 Seiten als gut geeignet, mehr möchte ich am Desktop-PC managen.


    Die verbreiteten/leistbaren kommerziellen OCR-Programme scheinen somit keine Option (mehr) bei Fraktur, da dieser Schnitt nicht unterstützt wird. Bei perfekten Scans (ev. auch sehr guten Abfotografien) sollten moderne Schriften (Serif/Sans) bei allen Dreien funktionieren. Suboptimale Abfotografien scheinen bei FineReader noch akzeptable Resultate zu bringen. Bei perfekten Frakturscans könnte gImageReader die einzige mögliche Option sein, wäre aber zu testen. Für mich ist dies leider nicht so interessant, da ich gerne Abfotografien nutzen würde (Scans dauern mir zu lang).

  • Ich habe die Beschreibung nicht ganz verstanden und würde gerne die Vorlage

    "Fraktur bei nicht perfekter Abfotographie" selbst mit Abbyy Finereader 15 testen.

    Die Frakturerkennung mit dort so genannter Schrift in "Altdeutsch" gibt es erst

    seit der Version 15. Ich habe die Version 15.0.117 und keine Probleme mit der Fraktur-

    erkennung. Insofern verstehe ich nicht, dass nur die Sprache Deutsch auszuwählen war.

    (vielleicht in der Version 15.0.114 noch nicht?)



  • Danke für den Hinweis zu "Altdeutsch". Habe bei meinem Kontakt das Nachprüfen lassen und mit Auswahl desselben (+Latein) wäre nun die von mir benötigte Schriftsatz- bzw. Sprachauswahl zusammen mit Deutsch komplett. Die Erkennung in den Bereichen wo die Zeilen erkannt werden ist nun brauchbar mit ca. 5-15 absehbaren Zeichenkorrekturen pro Seite.

    An den Rändern der Seite werden hingegen ein paar Wörter bzw. Spalten gar nicht oder sehr fehlerhaft erkannt. Insgesamt ähnlich bzw. bezüglich Formatierung leicht besser als gImageReader. Wenn man es schafft die Buchseiten genügend plan abzufotografieren könnte somit Fraktur-zu-OCR-Text brauchbar sein.

  • Beim abfotografieren habe ich ein Problem mit dem DPI-Maß (72) aus der Smartphone-Cam, welches generell nicht stimmt und nach Beschneiden der Buchseiten zu signifikant differender Ausgabegröße der einzelnen Seiten führt. Mit Software kann der DPI Wert einzeln pro JPG Datei an den Realwert angepasst werden ohne die Auflösung in Pixel der Datei selbst anzurühren (keine Re-Kompression).
    Bisher habe ich aber keine Software gefunden, die "intelligent" für einer große Anzahl an JPG (Batch-Verarbeitung) den DPI-Wert individuell so errechnet und neu abspeichert, dass z.B. die Höhe der Ausgabe konstant einen gewissen Wert (z.B. 25 cm) erreicht.
    Beim Scannen ist dies kein Problem, da der eingestellte Qualitätswert, z.B. 300 dpi und die Ausgabegröße genau genug passen.
    Hätte gehofft die Smartphone-Cam-App wäre im Dokumentmodus (habe diesen benutzt) vielleicht intelligent genug anhand von Fokuswerten/Distanz die DPI Zahl je JPG einzustellen, dieser bleibt aber fix auf 72.
    Auch weil die Fachbegriffe in deutsch oder englisch mir nicht genau bekannt sind, habe ich online nichts dazu gefunden. Die Suchergebnisse liefern massenhaft Ergebnisse die die Größenänderung (Skalierung mit Neuberechnung) einer Pixelbilddatei beschreiben, was mich aber eben nicht interessiert.

    EDIT: um zumindest bei allen Dateien gemeinsam einen besseren mittleren DPI Wert (Exif:XResolution,YResolution) einzustellen habe ich nun ExifToolGUI verwendet. In diesem Fall von 72 auf 200.


    EDIT2: die ziemlich gut funktionierende Lösung falls mehr als 2-3 Dutzend Seiten abfotografiert werden sollen ist die Verwendung von folgendem Setup:
    ein Stativ mit beweglichem Oberteil und Smartphone-Klemme mit einem Fuß höher gegen einen gut beleuchteten (bei Fenster, Lampen indirekt oder Seite) Tisch gelehnt, sodass die Smartphonekamera ober der Mitte des Buches im nötigen Abstand fixiert werden kann.

    Ein gutes Smartphone (Geschwindigkeit, Kamera-Eigenauflösung, Kamera-App mit Dokumentenmodus) und eine Möglichkeit abseits des Touchscreens auszulösen. Bin in Ermangelung von einfachen BT-Lösungen drauf gekommen, dass ein Headset mit Lautstärkeregelung in den Kamera-Apps als Auslöser funtioniert: sehr gut um Verwackelungen zu vermeiden. Mit diesem Setup müssen zwar weiterhin mit ExifToolGUI die DPI aller Dateien angepasst werden, aber der Wert stimmt nun homogen sehr gut und die Qualität der Bilder ist auch einheitlicher und besser. Mit einer (entspiegelten) Glasplatte könnte man das ganze noch verbessern, damit die abfotografierte Fläche planer wird, geht aber auf Kosten der Geschwindigkeit. Dieses Setup scheint mir sogar besser als per DSLR etc. Kameras, da ein Zwischenschritt (Foto-Optimierung und Beschneidung) durch einen guten Dokumente-Kamera-Modus vermieden werden kann.

    3 Mal editiert, zuletzt von ChrisR ()

  • Neuigkeiten zu vFlat: Die Texterkennung erlaubte bisher 100 Seiten pro Tag,in Kürze aber nur 10 im Monat. In Zukunft bleibt nur das Scannen kostenlos, die weiteren Funktionen sind dann mit 4,99 € im Monat bzw. 49,99 € im Jahr zu zahlen Darin enthalten Texterkennung von 3000 Seiten pro Monat.

  • Danke für den vFlat Hinweis. War leider abzusehen, 10 im Monat ist sehr "Basic", 50 wäre aktzeptabel. Hoffentlich bleibt wenigstens das optimierte Abfotografieren frei (von Werbung). MS Lens scheint somit die einzige Gratis Smartphone Bild zu hOCR-PDF, die befriedigend arbeitet (auch offline), die 100 Seiten pro Dokument-Beschränkung hat mich bisher nicht gestört. Unterwegs habe ich bisher nie mehr als 10 Seiten zu einem hOCR-PDF kombiniert.

    Einmal editiert, zuletzt von ChrisR ()