Seite 1 von 1
gscan2pdf meldet, dass es für tesseract kein language file findet
Verfasst: Mittwoch 7. Oktober 2020, 21:11
von Clemens
Sobald ich gscan2pdf starte, kommt die o.g. Meldung (sinngemäß wiedergegeben). Es ist nicht möglich, in gscan2pdf in der DropDown-Liste eine Sprachdatei auszuwählen, obwohl ich bei mir englisch und deutsch installiert habe.
Diese Fehlermeldung kommt erst seit dem gerade stattgefundenen größeren Manjaro Update.
Nun ist zu klären, ob es an gscann2pdf liegt oder an tesseract. Hierzu habe ich im Terminal geprüft:
Code: Alles auswählen
...$ tesseract --list-langs
Error opening data file /usr/share/tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
List of available languages (2):
deu
osd
Es liegt demnach an tesseract selbst, welches seine eigenen Sprachdateien nicht findet. Ich weiß zudem nicht, wo man denn tesseract die benötigte Umgebungsvariable TESSDATA_PREFIX mitteilen kann.
Glücklicher Weise scannt gscan2pdf auch ohne tesseract einwandfrei. Nur die tesseract Fehlereldung nervt natürlich. Wie kann ich das reparieren?
Re: gscan2pdf meldet, dass es für tesseract kein language file findet
Verfasst: Mittwoch 7. Oktober 2020, 22:48
von gosia
Hallo Clemens,
probiere mal diese Anleitung
https://www.pyimagesearch.com/2020/08/0 ... languages/
da ist zwar u.a. von Ubuntu die Rede, aber das lässt sich auch auf Manjaro übertragen. Die Sprachdatei musst Du dir natürlich nicht von github holen, sondern von den Repos. Das Paket heisst tesseract-data-deu
viele Grüße gosia
Re: gscan2pdf meldet, dass es für tesseract kein language file findet
Verfasst: Dienstag 1. Dezember 2020, 21:13
von Clemens
Der Fehler ist immer noch da, obwohl ich das deutsche Sprachpaket installiert hatte. Tesseract scheint das aber nicht zur Kenntnis zu nehmen. Muss ich da in irgendeiner Config was ändern /korrigieren?
Re: gscan2pdf meldet, dass es für tesseract kein language file findet
Verfasst: Dienstag 1. Dezember 2020, 21:36
von gosia
Hallo Clemens,
naja, ich habe noch kein tesseract installiert, kann also nicht so viel aus dem Nähkästchen plaudern. Aber deine Angaben sehen auch etwas knapp aus
Clemens hat geschrieben: Dienstag 1. Dezember 2020, 21:13
obwohl ich das deutsche Sprachpaket installiert hatte
wenn Du "nur" installiert hast, so wird das wohl noch etwas zuwenig sein. Wie sieht es z.B. mit dem Setzen der Umgebungsvariable TESSDATA_PREFIX aus?
Was sagt
gibt das den exakten Pfad zum tessdata Verzeichnis aus?
viele Grüße gosia
Re: gscan2pdf meldet, dass es für tesseract kein language file findet
Verfasst: Dienstag 1. Dezember 2020, 23:12
von Clemens
Wenn ich
eingebe, kommt gar keine Reaktion, also kein Pfad o.ä.
Wo setze ich denn die Umgebungsvariable?
Re: gscan2pdf meldet, dass es für tesseract kein language file findet
Verfasst: Dienstag 1. Dezember 2020, 23:53
von gosia
Hallo Clemens,
Clemens hat geschrieben: Dienstag 1. Dezember 2020, 23:12
Wo setze ich denn die Umgebungsvariable?
/PFAD/ZU/TESSDATA/DIR musst Du natürlich anpassen.
Damit das dauerhaft bleibt die Zeile in die ~/.bashrc schreiben und dann neu booten.
viele Grüße gosia
Re: gscan2pdf meldet, dass es für tesseract kein language file findet
Verfasst: Mittwoch 2. Dezember 2020, 11:07
von Clemens
Danke für deine Antwort. Ich hab zunächst im Pacman nachgeschaut, wohin denn das deutsche Sprachpaket installiert worden ist und dies mit dem realen Vorhandensein der Datei an der vorgesehenen Stelle geprüft.
Demnach gab ich ins Terminal:
Der anschließende Test durch einen Start von gscan2pdf brachte aber die gleiche Fehlermeldung wie bisher.
Da dies also nicht funktioniert hat, habe ich die o.g. Zeile nicht in bashrc eingetragen.
Sicherheitshalber gab ich im Terminal noch den o.g. Pfad und zusätzlich danach die Datei deu.traineddata mit ein, was aber leider auch nicht den gewünschten Erfolg brachte.
Glücklicher Weise benötige ich Tesseract bisher nicht. Aber die Meldung nervt, obwohl ich sie ja auch abschalten könnte. Lieber will ich aber ein funktionierendes Tesseract, für den Fall, dass ich es doch mal plötzlich benötige.
Re: gscan2pdf meldet, dass es für tesseract kein language file findet
Verfasst: Mittwoch 2. Dezember 2020, 12:32
von gosia
Hallo Clemens,
wäre auch zu schön gewesen

Aber da ich Tesseract schon lange mal ausprobieren wollte, werde ich es mal installieren. Komme aber erst am Wochenende dazu. Aber bis dahin meldet sich bestimmt noch jemand.
viele Grüße gosia
Re: gscan2pdf meldet, dass es für tesseract kein language file findet
Verfasst: Freitag 4. Dezember 2020, 15:29
von gosia
Hallo Clemens,
irgendwie bin ich in die falsche Richtung marschiert

Wenn man genau hinsieht, dann ist ja nicht "deutsch" das Problemkind sondern "englisch"
Clemens hat geschrieben: Mittwoch 7. Oktober 2020, 21:11
...$ tesseract --list-langs
Error opening data file /usr/share/tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
List of available languages (2):
deu
osd
Jedenfalls habe ich das Problem nicht
Code: Alles auswählen
tesseract --list-langs
List of available languages (3):
deu
eng
osd
aber ich habe auch einen anderen Pfad für tesseract. Bei mir liegt das ganze Zeug unter
Kannst ja mal nachsehen, ob das bei dir auch so ist.
Code: Alles auswählen
ls -l /usr/share/tesseract-ocr/4.00/tessdata/
drwxr-xr-x 2 root root 4096 Okt 1 15:52 configs
-rw-r--r-- 1 root root 1525436 Sep 15 2017 deu.traineddata
-rw-r--r-- 1 root root 4113088 Sep 15 2017 eng.traineddata
-rw-r--r-- 1 root root 10562727 Sep 15 2017 osd.traineddata
-rw-r--r-- 1 root root 572 Jan 21 2019 pdf.ttf
drwxr-xr-x 2 root root 4096 Okt 1 15:52 tessconfigs
aber ich sehe gerade, Du sagst ja, dass bei dir alles unter /usr/share/tessdata/ liegt
Clemens hat geschrieben: Mittwoch 2. Dezember 2020, 11:07
dies mit dem realen Vorhandensein der Datei an der vorgesehenen Stelle geprüft.
Da fallen mir im Moment nur mangelnde Rechte ein. Was sagt denn bei dir
Code: Alles auswählen
ls -ld /usr/share/tessdata/
ls -l /usr/share/tessdata/
viele Grüße gosia
Re: gscan2pdf meldet, dass es für tesseract kein language file findet
Verfasst: Freitag 4. Dezember 2020, 23:58
von Clemens
Ich danke dir. Den Fehler hab ich jetzt durch deine Anregung gefunden. Zwar meldet mir gscan2pdf, dass die deutsche Sprachversion fehlen würde. Tatsächlich aber fehlt in meiner Installation erstaunlicher Weise die englische Sprachversion. Nachdem ich die englische Sprachdatei über Pacman ganz normal installiert hatte – zusätzlich zu der deutschen – startete gscan2pdf ohne die Tesseract-Fehlermeldung.
Nun erhalte ich nur noch zwei Fehlermeldungen beim Start von gsacn2pdf, die sich auf eine fehlende Verschlüsselungsmöglichkeit für PDFs sowie auf ein fehlendes Modul zur Ausgabe in einem weiteren Format beziehen. Das benötige ich aber nicht und so habe ich die Meldung jetzt deaktiviert.
Problem Tesseract deutsch ist also damit gelöst!