OCR ελληνικών χαρακτήρων

#1

Υπάρχει κάτι για pdf; Έχω βρει 2-3 τα οποία έχουν πολλά χρόνια να ανανεωθούν ή υποστηρίζουν μόνο εικόνες και όχι pdf.

#2

Το Tesseract-OCR και το gImageReader υποστηριζουν και Ελληνικα αλλα και PDF τουλαχιστον στο Debian 9.9 (και πιστευω μεχρι να ερθει και το 10 θα ειναι μια καλη λυση και θα υποστηριζεται για πολυ καιρο ακομα).

Λογικα θα πρεπει επισεις να υπαρχει και σε Ubuntu και Mint αλλα και αλλων διανομων που στηρίζονται στο Debian. Ριξε μια ματια στο repository της διανομης σου και δες αν υπαρχει.

#3

το είχα δοκιμάσει παλαιότερα και θυμάμαι είχα προβλήματα, τώρα το ξανά δοκίμασα από τα repositories του mint και λειτουργεί αρκετά καλά βλέπω.