[ubuntu-ar] PDFs de imagenes con OCR

Roman Gelbort roman at piensalibre.com.ar
Fri May 21 12:58:38 BST 2010


El 21/05/10 08:41, Alberto Rosenberg escribió:

> pero el software de windows al digitalizar da la opción de crear pdf, y
> estos pdf dentro tienen la opción de buscar texto, porque previamente
> hace el ocr, cuando uno abre el documento pdf esta mirando la imagen
> digital de un texto, pero el acrobat reader permite hacer busques en el
> y marcar copiar y pegar en otro documento, yo sabía que el acrobar (creo
> que la versión 8) permitia realizar este tipo de pdf, lo que es poder
> hacer esto en linux.

Para extraer las imágenes contenidas en un pdf podés usar el programa
"pdfimages" desde consola. Luego, aplicar el ocr a esas imágenes.

P.D.: ¿no era más fácil escanear correctamente las páginas? ;-)

-- 
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Prof. Román H. Gelbort
Hagamos Cultura y Software Libres entre todos
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~



More information about the Ubuntu-ar mailing list