Institution: Institut für Computerlinguistik , Universität Zürich
Projektleitung: Martin Volk
E-mail: Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!

SACKokos

SACKokos stellte die Jahrbücher des Schweizerischen Alpenclubs von 1864 bis 1899 zum Lesen und Durchsuchen bereit und ermöglichte es, Erkennungsfehler aus dem Digitalisierungsprozess sofort zu korrigieren. Das Projekt ist abgeschlossen, zum Archiv der SAC-Publikationen geht es hier:

Worum geht es in dem Projekt konkret?

Die OCR-Texterkennungsqualität der Jahrbücher des SAC war teilweise schlecht. Um die Texte besser zu analysieren und durchsuchen zu können, müssen sie manuell korrigiert werden.

Wie können Bürger:innen mitforschen?

Man kann die Texte lesen und Texterkennungsfehler (OCR-Fehler) korrigieren.

Was passiert mit den Ergebnissen?

Ein frei verfügbares Korpus mit den Bilder, unkorrigierten und korrigierten Texten des 19. Jahrhunderts wurde veröffentlicht: Download

Schlagwörter
  • sprache
  • texterkennung
Gelesen 37 mal| Letzte Änderung am Montag, 01 März 2021 18:36

Logo Akademie der Wissenschaften Schweiz Science et Cité Logo DE