Convertire documenti scansionati in documenti di testo con Google OCR



Un documento scannerizzato altro non è che un’immagine quindi non possiamo copiare e incollare il testo presente all’interno. Esistono porgrammi ORC che riescono a estrapolare il testo dai documenti.

Se non abbiamo questi programmi possiamo affidarci al solito Google…

Ecco come fare: Fate una scansione di un documento e create un pdf, all’interno del vostro sito web create una cartella (es. nomesito.com/pdf) e mettete tutte le immagini pdf in questa cartella.

Create una pagina pubblica che linka tutti i file pdf e attendiamo che Google bots passi da li!!

Una volta fatto su Google digita la query: “site:nomesito.com/pdf filetype:pdf” per visualizzare il documento pdf come un documento html.

Fonte: Convert Scanned PDF Documents to Text with Google OCR from Digital Inspiration

Posted on November 1st, 2008 under seo, web

Nuovo Page Rank per mukkamu



Stamattina ho avuto la bella sorpresa di trovare il pagerank di mukkamu a quota 6, subendo un incremento di 1.
Strano è che non ho sentito nessuna voce di corridoio su eventuali aggiornamenti di google sui PR.
Ho notato anche un cambiamento sostanziale del numero di link che puntano a questo sito (sempre secondo google) che da 966 sono passati a 5870.

Che google stia cambiando qualcosa nelle sue formule matematiche? Ho è l’effetto del brindisi in ASCII di fine anno?
Staremo a vedere che cosa succede in questi giorni, e se nessuno sa qualcosa in merito!

Posted on January 12th, 2008 under seo, web

Cambierà il modo di pensare dei motori di ricerca




Grazie a Julius oggi sono approdata sul sito ICTv Il video che ho postato l’ho trovato interessante; raccoglie in un’intervista il parere di Piersante Paneghel “Pieropan”, Giorgio Taverniti “Giorgiotave“, Salvatore Cariello ed Enrico Altavilla “LowLevel” su quello che sarà il futuro degli algoritmi dei motori di ricerca, e su come e verso quale meta punteranno. Cercheranno di aggiornare le loro regole algoritmiche a seconda di come gli utenti utilizzeranno sempre più il web, e gli utenti e i poveri martiri, che vogliono dare visibilità a qualche sito dovranno adeguarsi a loro leggi matematiche e logiche!

Posted on June 1st, 2007 under seo, web