Beiträge von Angemeldet

    Ja, Acrobat 9 ist für Fraktur völlig ungeeignet. Die Alternativen zu Abbey sind indes immer noch ziemlich rar. Aber es wird ja geforscht, wie ich höre. Gibt es denn Erfahrungen mit OCRopus? Das wäre dann natürlich noch mehr was für Programmier oder allgemein erfahrenere Nutzer, aber wie ich hier las, scheint es, ebenso wie tesseract 2016 auf eine KI-basierte Technologie umgestellt worden zu sein. Heißt, je mehr Training desto bessere Erkennungsraten.


    Stimmt das? Hat hier schon jemand mit OpusOCR gearbeitet oder Erfahrungen mit besser werdenden Erkennungsraten bei der Vielnutzung von tesseract?

    Ist auf jedenfall eine Abkürzung, vom Buchstabenmaterial her tippe ich auf Ew. oder Es (?). Ob das hinkommen kann, hängt aber auch von der Entstehungszeit und dem Empfänger ab. Ohne Kontext kann ich hier nicht viel mehr sagen.

    Ja, mit "akademisch" oder "fachlich ausgerichtet" oder "nur für öffentliche Institutionen" kann man viel entschuldigen. An meinem Arbeitsrechner (also nicht der beschriebene, sondern an einem anderen Arbeitsplatz) läuft AUGIAS. Der Installateur vom Amtsrechenzentrum, der es damals eingerichtet hat, meinte gleich..."Oh, da werden Sie mit Ihrer CPU Probleme kriegen (uralter AMD-Prozessor)". Seitdem hatten wir unzählige Plagen und Datenverluste hinter uns, Exportfunktionen haben nicht funktioniert, zugeteilte Bestandskürzel verschwanden im Nirvana und es wurde immer auf den zu schwachen Rechner geschoben. Zuletzt habe ich gemahnt, als wir vom Amt auf Windows 10 zwangsgeupgradet worden sind, dass das dem Programm den Rest geben würde. Und siehe da - Verbindung zum lokalen Server (!) war danach nicht mehr möglich. Alle möglichen Tricks, die wir ausprobiert haben, sind gescheitert, die .msi war wohl auch beschädigt und AUGIAS musste deinstalliert werden.

    Zum Glück hatte ich die ganzen Bestandsinformationen nochmal als gute alte Excel-Dateien gespeichert, so unpraktisch das auch sein mochte.


    Das mit den Ligaturen ist natürlich blöd, aber es hätte mich weniger gestört, wenn der Rest des Programms funktioniert hätte. Die Mehrseiten-PDFs habe ich damals als einzelne TIFF-Dateien exportiert (für die Transkribus im Übrigen jedesmal einen Extra-Ordner braucht), aber unter den vielen einzelnen TIFF-Seiten ist Transkribus dann eben auch eingeknickt (oder der Rechner). Wir haben mal spaßeshalber überschlagen, was es uns an Speicherkapazität gekostet hätte, wenn das Importieren der vielen Seiten funktioniert hätte und wir jedes (doch irgendo) komprimierte PDF in einzelne TIFF-Bilder umgewandelt hätten. Da wäre das Programm schnell unbezahlbar geworden, auch bei kostenlosem Download.


    Alles in allem kann man also sagen, Transkribus ist vielleicht eine gute Einmalhilfe für absolut Leseunkundige und etwas für Universitätsrechenzentren. Aber für den Otttonormaldigitalisierer und Kleinarchivar momentan noch völlig unausgereift und unpraktikabel.

    Anderer Rechner heißt, ein anderer Rechner als bei mir zu Hause. Im Büro bei uns stehen zwei Arbeitsrechner, einer für Schrifterkennung und Digitalisierung wird zusammen (und am meisten) verwendet. Im Moment arbeiten wir da vornehmlich mit Acrobat 9 drauf. Den habe ich ausprobiert

    Der Rechner, Windows 7 Ultimate 64 Bit, CPU AMD Athlon II X 620 mit 2,6 GHz (ist demenstprechend ausgelastet), 2 TB SSD, aufgeteilt auf 2 Partitionen, eine davon voll und die Systempartition wird vom Kollegen regelmäßig zugemüllt (jemand, der glaubt, alles, was nicht auf dem Desktop zu sehen ist, wurde gelöscht). Arbeitsspeicher 16 GB DDR 3 RAM


    Java kommt ins Spiel, wenn ich Transkribus installiere, dann fragt mich das Programm nämlich nach der neuesten Java-Laufzeitumgebung, jetzt glaube 8 irgendwas, die aber schon lang installiert ist. Nachdem ich dann Java erneut installiert habe, öffnet sich Transkribus nicht mehr, was eine Neuanmeldung mit einem weiteren Account und eine Neuinstallation notwendig macht und schon kann ich es öffnen. Das Spielchen habe ich jetzt zweimal hinter mir (habe jetzt also 4 Accounts) und beide Male war es die gleiche Misere.


    Das mit den Sprachen ist schon klar. Aber wenn das Programm einmal ein in "Latein" geschriebenes e erkannt hat, sollte man doch eigentlich erwarten, dass es dann auch einigermaßen zuverlässig weitere es erkennt.

    Habe es erst vor Kurzem mal wieder auf einem anderen Rechner im Büro ausprobiert. Die maximale Benutzerfeindlichkeit (mit Anmeldegedöns auf dem Server) hatte mich eigentlich schon beim ersten Mal abgeschreckt, aber nachdem ich es, ebenfalls nach Überwindung der Java-Probleme, zum Laufen bekommen hatte, muss ich sagen, es war gar nicht mal so...


    ...gut, wie ich es in Erinnerung hatte. Gerade die Texterkennung bei speziellen Wendungen und wiederkehrenden lateinischen Rechtsausdrücken ist offensichtlich nicht zu machen. Wer lateinische Texte abschreibt, weiß, wie lang das dauern kann, von daher hilft es mehr als es schadet, wenn man hinterher erstmal den Sinn wiederherstellen muss, zumal bei ganz offensichtlichen Fehlern wie "seit" statt"scit". Die Textsegemente und Baselines lassen sich, einmal gezogen, weder verändern noch einfach wieder entfernen, jedenfalls war es bei mir so. Als dann auch noch der FTP-Server streikte, weil der Rechner von einem vollkommen unzulänglichen und verbrecherischen Provider abhängt (ich schreibe hier natürlich nicht den Namen, der mit V anfängt, das wäre geschäftsschädigend), habe ich es aufgegeben.

    Lokal ist das Ding für Bücher so gut wie unbrauchbar, außer man hat zwei Tage Zeit, um auf die Fehlermeldung zu warten, dass auf Grund der Seitengröße nicht alle Seiten geladen werden konnten. Keine Verarbeitung von Mehrseiten-Pdfs ist bei der gängigen Digitalisierungspraxis von Bibliotheken und Archiven ohnehin eine Frechheit. In der Zeit, die ich mit diesem Programm verschwende, habe ich schon zehn bis zwanzig Seiten abgeschrieben. Ich warte lieber, bis man dort auf die Idee verfällt, mit den EU-Mitteln mal ein anständiges GUI zu entwickeln. Es ist schon kurios, dass ausgerechnet die teuerste Firmware immer wieder durch schlimmste Bedienoberflächen, Instabilität, Sicherheitslücken und immensen Datenverlust glänzt. Anscheinend ist das das, was man erwarten kann, wenn man Programmierer anständig für ihre Arbeit bezahlt.

    Zerung sambtt 20 fl rode Bivoll (??) und 5 fl von d(er) stuben


    Ich hätte auf einen Posten zu Reisekosten getippt, also Zährung, Kleidung und Getränke (Stübchen), es kann aber auch alles erdenklich andere sein. Ich will, wie gesagt, keine falschen Fährten legen.

    Also ich habe eine (nicht wirklich gute) Idee, aber ich habe in letzter Zeit schon so oft verkehrt gelegen oder dir nur so mäßig weiterhelfen können, dass ich hier lieber gar nichts schreibe, bevor sich nicht jemand anders meldet.


    Erstes Wort ist Zerung.

    Oeconomie meint hier einen Wirtschaftshof, also eine Landwirtschaft, die schon im 18. Jahrhundert mit kleinen Gewinnenen kapitalisiert wurde. Meistens waren das Meiereien, Vorwerke, landesherrliche Domänen, Freigüter oder sonstwie adlige Güter, in diesem Fall wohl ein Eigenbesitz des Landwirts.


    Vergleiche mal den Artikel zum Landwirt bei Krünitz online http://www.kruenitz1.uni-trier.de/site/a_to_z.htm. Da solltest du dir eine Vorstellung machen können.

    oha, in der Zeile verrutscht, also nochmal


    consors= gemeinschaftlich


    bei den Eltern

    Magister Asciarius= Zimmermeister


    bei den Paten

    Praxator= Brauer


    In beiden Spalten steht hinter dem Beruf Sentensis. Ich vermute eine Ortsherkunft, denn eine neulateinische Form von sententia (Meinung) macht hier wenig Sinn.