Guida: come estrarre il testo da un file PDF scannerizzato

Lorenzo Pescatore


In questo tutorial si mostra come estrarre il testo di un documento PDF per poi incollarlo sul programma di video scrittura.


Ciao sono Lorenzo Pescatore e ti do il benvenuto in questo nuovo video.
Oggi ti mostrero’ come estrarre del testo da un documento PDF scannerizzato in modo da poterlo incollare sul tuo programma di videoscrittura per una successiva modifica.

Prima di cominciare, come sempre, ti ricordo che se desideri installare la barra PCT oppure vuoi conoscere i piani personalizzati di assistenza e consulenza agli studi legali in ambito
PCT puoi contattarmi all’indirizzo mail che troverai alla fine del video…

INIZIAMO…
Tra le esigenze piu’ ricorrenti dei miei clienti Avvocati, c’e’ quella di prelevare del testo per il copia incolla, di sentenze, atti processuali ed in generale documenti vari.
Tutto questo e’ possibile solo se ci troviamo davanti ad un PDF nativo e cioe’ un PDF ottenuto dalla trasformazione da un file di testo tipo WORD.
Su un file scannerizzato, apparentemente questa operazione non e’ possibile, ma oggi ci sono degli strumenti utili e gratuiti che ci consentono comunque di ottenere dei buoni risultati
di riconoscimento del testo.
Sul mio desktop ho un file PDF che contiene al suo interno un estratto di una sentenza della Cassazione.

Come puoi vedere, e’ una sentenza scannerizzata.
Puoi accorgertene dalla presenza di timbri e firme grafiche ma soprattutto dal fatto che se provi a selezionare una parte di testo tutto cio’ e’ impossibile poiche’ la scannerizzazione trasforma le pagine del documento come se fossero un unico blocco.
Per consentire l’estrazione del TESTO, utilizzero’ un’applicazione gratuita online che fa parte della suite PDF 24.org
Se hai la barra PCT, recati sul menu’ PDF Utilita e seleziona la voce RICONOSCIMENTO OCR….

Verrai indirizzato direttamente sulla pagina internet che ti servira’ per questa operazione.
Se non hai la BARRA PCT cerca la pagina su google.
Fai click su SCEGLIERE I FILE e seleziona il documento dal tuo desktop.
Se lo desideri puoi scegliere piu’ documenti selezionando l’icona con il segno piu’ e puoi decidere di prelevarli anche dal tuo google drive o dropbox..
Imposta la lingua per il riconoscimento in italiano….

Su tipologia di file in uscita seleziona il semplice PDF….
Infine hai delle opzioni piu’ o meno utili come quella che ti consente di unire tutti i file che avevi selezionato sopra in un unico PDF.
Adesso clicca su AVVIA l’OCR.

L’applicativo inizia ad elaborare il file. I tempi di lavorazione sono proporzionali alla dimensione del files e quindi al numero di pagine in esso contenute ed anche al traffico di richieste che in quel momento ha il sito.
L’elaborazione e’ stata completata.
Adesso puoi scaricare il file pdf sul tuo desktop.

Apri il file.
Come potrai notare, a differenza di prima, adesso puoi selezionare il testo.
Una volta selezionata fai clic con il tasto destro e quindi COPIA.
Ora apri il tuo programma di videoscrittura.
Io sto utilizzando word ma va bene anche con openoffice e qualsiasi altro software.
In un punto qualsiasi del documento vuoto fai click con il tasto destro del mouse e poi selezione incolla o dalla tastiera selezione i tasti CONTROL e V di Verona.
Ecco il risultato.

Adesso hai il testo che ti interessa e puoi modificarlo a tuo piacimento.

Eventualmente lo puoi ritrasformare in pdf con la solita procedura interna di salvataggio presente in ogni programma di videoscrittura.
Bene, siamo giunti al termine di questo brevissimo video e spero che ti sia stato utile.
Ti ricordo di iscriverti gratuitamente al canale per ricevere tutti gli aggiornamenti sui video di prossima pubblicazione e se sei interessato alla BARRA PCT o ad assistenza e consulenza
personalizzata puoi contattarmi all’indirizzo mail in sovrimpressione.
E’ tutto per oggi, da Lorenzo Pescatore, BUON PCT A TUTTI.

 

Condivi con:
STAMPA