Trasformare immagini in testo con Softi FreeOCR

Dalla carta ai bit: programma gratuito per trasformare immagini in testo con pochi click.

Il riconoscimento ottico dei caratteri, o semplicemente OCR, permette di trasformare un documento cartaceo passato sotto scanner in un documento digitale modificabile e integrabile – mediante l’ausilio di un editor di testo – come ad esempio Word e simili, in altro documento. Per farlo, vi segnaliamo un software che, nelle situazioni non critiche (testo stampato e non scritto a mano) riesce ad assolvere egregiamente al proprio compito pur essendo completamente gratuito: FreeOCR.

Installazione

Dalla homepage del sito del prodotto, clicchiamo sul pulsante Download per scaricare il programma sul PC. Terminato il download avviamo l’installazione del software. Prima dell’uso, occorre installare i file per la lingua italiana in modo che possano essere riconosciuti dal programma anche i testi scritti nella nostra lingua.

Possiamo farlo collegandoci all’indirizzo indicato: nella pagina visualizzata facciamo clic sul collegamento “Click Here for filtered list” dall’elenco che appare e scarichiamo il file tesseract-2.00.ita.tar.gz in una cartella sul nostro PC. Terminato anche questo passaggio scompattiamo il file compresso e avviamo il software FreeOcr.

Una volta aperto il programma facciamo clic sul menu Settings e scegliamo la voce “Open Language Folder”. A questo punto copiamo nella cartella aperta i file della lingua precedentemente scaricati. Terminata l’operazione chiudiamo e riapriamo il programma per rendere operative le modifiche apportate. Se tutto è andato a buon fine, dovremmo notare la dicitura ita all’interno della casella OCR language.

Primo OCR

L’operazione di riconoscimento potrà avvenire sia da scanner che da file salvato su nostro hard disk. I formati supportati da Free OCR sono svariati (tif, jpg, bmp, gif, png e pdf).

Qualora decidessimo di acquisire un documento dallo scanner occorre innanzitutto fare clic sul pulsante Scan (Scan new document), scegliere il dispositivo di acquisizione e utilizzare come impostazione di acquisizione una risoluzione di 300 dpi in scala di grigio (se il documento contiene solo testo), altrimenti possiamo scegliere di acquisire a colori, mantenendo la risoluzione a 300 dpi.