Convertire documenti scansionati in documenti di testo con Google OCR

Un documento scannerizzato altro non è che un’immagine quindi non possiamo copiare e incollare il testo presente all’interno. Esistono porgrammi ORC che riescono a estrapolare il testo dai documenti.

Se non abbiamo questi programmi possiamo affidarci al solito Google…

Ecco come fare: Fate una scansione di un documento e create un pdf, all’interno del vostro sito web create una cartella (es. nomesito.com/pdf) e mettete tutte le immagini pdf in questa cartella.

Create una pagina pubblica che linka tutti i file pdf e attendiamo che Google bots passi da li!!

Una volta fatto su Google digita la query: “site:nomesito.com/pdf filetype:pdf” per visualizzare il documento pdf come un documento html.

Fonte: Convert Scanned PDF Documents to Text with Google OCR from Digital Inspiration

2 commenti su “Convertire documenti scansionati in documenti di testo con Google OCR

  1. può essere una buona idea,
    dico solo che google ha anche rilasciato tesseract un motore opensource di ocr qua trovi una’applicazione con una gui grafica freeware che lo usa qui,
    ,la pagina è tradotta dall’italiano all’inglese usando ….google,
    ciao

Rispondi

Articoli correlati

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto