mit der App vFlat kostenlos und in Superqualität - von einer koreanischen Software unerwartet - die Texterkennung von Frakturtexten durchführen kann
von der App vFlat so begeistert, weil man dort die Seiten schlichtweg abfotografieren kann und die Wellung der Buchseite durch die App korrigiert wird. Hinzu kommt dann noch die kostenfreie und sehr gute Texterkennung.
Allerdings fehlt mir eine gute Beschreibung der Funktionen, ich kann den Texterkennungsvorgang jeweils für jede Einzelseite duchführen. Vielleicht gibt es dazu eine von mir noch nchht entdeckte Möglichkeit. Deshalb kopiere ich die so erfassten Seiten dann doch auf den PC und nutze dann Abbyy Finereader 16 zur Texterkennung.
Ob diese neueste Abbyy-Version die Erkennung von Frakturschrift verbessert hat, kann ich nicht feststellen. Allerdings ist die Fehlerkorrektur deutlich einfacher als in der Vorversion.
In der Tat eine interessante Dokumentenfotografier- und OCR-App abseits der bekannten Anbieter, habe sie probiert. OCR scheint allerdings nicht (mehr?) grenzenlos kostenlos zu sein, zumindest in meiner Installation wird "Text recognition credit 100 pages" angezeigt. Bei antippen steht "daily free credit", also 100 Seiten am Tag sind gratis und bezüglich mehr "credits" gibt es die Option Werbung anzuschauen (10 credits) oder dafür zu bezahlen (funktioniert bei mir derzeit nicht).
Die App ist jedenfalls interessant für optimierte Dokumentenabfotografie, falls die Standard-Cam das nicht bietet. Die Anx-Cam in Xiaomi-MIUI (siehe auch Port für Custom-ROMs) bietet das z.B. und funktioniert recht gut. Samsung bietet da leider anscheinend (zumindest in der vorletzten Galaxy-Generation) nichts. Google Lens (auf Pixel) wäre vom Ansatz her interessant, aber reine Text-OCR kann auch die Libre-FOSS "OCR" (siehe F-Droid) basierend auf Tesseract. Privacy (=lokale Offlineverarbeitung), zumindest bei Umgang mit nicht so alten Dokumenten, ist für mich auch relevant. Als Resultat ist in meinem Fall sowohl eine optimierte Abfotografie ("Scan") des Buches/Dokumentes, als auch ein hOCR-PDF interessant. Zumindest habe ich noch kein anderes leicht durchsuchbares/kompatibles Dateiformat gefunden.
Deshalb scheint auch bei mir der Weg
1) optimerte Abfotografie am Smartphone
2) Kopie zum PC und Anwendung hOCR-PDF-Software
derzeit die beste Lösung.
Bezüglich Abbyy Finereader 16 einfachere Fehlerkorrektur: ich kenne bzw. habe Möglichkeit die Version 15 zu nutzen. Die Frage ist ob es große Unterschiede gibt, bzw. Adobe Acrobat (Version ?) hier mit neuester Variante einen Vorteil bietet.
Das Problem ist, man müsste immer die aktuellsten Vollversionen für den eigenen Use-Case gut und umfangreich durchtesten, um hier eine valide Entscheidung zu treffen, oder halt das momentan erzielbare Resultat als ausreichend zu akzeptieren.
EDIT: Auf einen Hinweis hin habe ich die Microsoft Lens App ausprobiert. Überraschenderweise funktioniert die App auch ohne MS-Login und sogar offline. Nach Auswahl der Option wird ein hOCR-PDF erzeugt. Andere Optionen sind das Speichern der Scan-Fotografie in der Galerie und über MS-Login Konvertierung nach Word, PowerPoint, OneDrive, OneNote.
Die Bildoptimierung vor OCR scheint nicht so ausgeklügelt (oder KI-unterstützt) zu sein wie anderswo, aber die Offline-OCR ist sicherlich sehr gut für Android-Apps laut meinen Vergleichen. Die Mängel, die mir nach einem kurzen Test aufgefallen sind, sind fehlende Leerzeichen und das Nichterkennen von Listen/Tabellen. Basierend auf App-Bewertungen scheint die Dokumenten-/Bucherstellung auf 100 Seiten begrenzt zu sein, ich bin mir nicht sicher, ob es aus Leistungs- oder anderen Gründen so ist, aber ich denke, es ist in Ordnung.
Vielleicht ist "scannen" mit Anx-Cam oder vFlat und dann OCR des Bildes mit MS Lens ein guter Prozess auf dem Smartphone, dass muss ich noch ausprobieren. Bei großen Projekten ist es sicherlich am besten, OCR auf einem PC durchzuführen.