Non di rado capita di voler modificare o alterare dei documenti PDF scansionati/scannerizzati, specialmente al fine di applicare variazioni alla dimensione del testo, cambiare le immagini o estrarre i contenuti testuali. Ebbene, in quest'articolo ti spiegherò il modo più semplice per estrarre il testo da PDF immagine usando PDFelement.
Per svolgere con successo quest'operazione, è sufficiente usare un estrattore di testi da PDF immagine. Il migliore è PDFelement. Questo programma consente di eseguire l'OCR per modificare i PDF scansionati a proprio piacimento. Come se non bastasse, la funzione OCR è multilingua e può riconoscere oltre 20 lingue.
Ma vediamo un po' di esplorare le funzioni che caratterizzano questo programma:
- Permette di convertire i PDF in formati quali Excel, Testo, PowerPoint, Word, Immagine, ecc.
- Permette di modificare i contenuti dei PDF, compresi testo, pagine, immagini, segnalibri e filigrane.
- Permette di creare PDF a partire da documenti vuoti, HTML, altri PDF, immagini, ecc.
- Permette di proteggere i documenti PDF tramite password e permessi che limitano l'accesso da parte di soggetti non autorizzati.
- Permette di compilare moduli PDF, compresi quelli presenti in documenti scansionati. E se non hai un modulo già pronto, potrai crearlo usando i numerosi strumenti a disposizione.
Come Estrarre il Testo dai PDF Immagine
Primo Passaggio. Apri il Tuo PDF Immagine
Una volta installato PDFelement, aprilo e preparati ad eseguire l'OCR sul tuo PDF. Come prima cosa, avvia PDFelement, quindi clicca su Apri per caricare il documento scansionato nel programma. Assicurati di selezionare il documento corretto.
Secondo Passaggio. Esegui l'OCR
Dopo aver aperto il documento all'interno del programma, quest'ultimo rileverà che si tratta di un PDF scansionato e ti inviterà ad eseguire l'OCR: Clicca su Esegui OCR dalla barra gialla in alto, quindi seleziona la lingua e clicca su OK. La lingua predefinita è l'Inglese, ma puoi cambiarla e impostare quella che preferisci.
Terzo Passaggio. Estrai il Testo da un PDF Immagine
In seguito all'esecuzione dell'OCR, è necessario estrarre il testo dal PDF: Per farlo, clicca sulla scheda Modifica e poi su Modifica Testo. Seleziona il testo desiderato, cliccaci su per due volte e seleziona Copia.
In alternativa, puoi convertire il PDF in un documento Word. Per farlo, clicca sul pulsante In Word dalla scheda Home. Clicca sul pulsante Converti nella nuova schermata per convertire il tuo PDF in un documento Word. Ora avrai il tuo PDF in formato modificabile e potrai finalmente estrarne liberamente il testo.
Salvatore Marin
staff Editor