[ubuntu-ar] PDFs de imagenes con OCR
Roman Gelbort
roman at piensalibre.com.ar
Fri May 21 12:58:38 BST 2010
El 21/05/10 08:41, Alberto Rosenberg escribió:
> pero el software de windows al digitalizar da la opción de crear pdf, y
> estos pdf dentro tienen la opción de buscar texto, porque previamente
> hace el ocr, cuando uno abre el documento pdf esta mirando la imagen
> digital de un texto, pero el acrobat reader permite hacer busques en el
> y marcar copiar y pegar en otro documento, yo sabía que el acrobar (creo
> que la versión 8) permitia realizar este tipo de pdf, lo que es poder
> hacer esto en linux.
Para extraer las imágenes contenidas en un pdf podés usar el programa
"pdfimages" desde consola. Luego, aplicar el ocr a esas imágenes.
P.D.: ¿no era más fácil escanear correctamente las páginas? ;-)
--
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Prof. Román H. Gelbort
Hagamos Cultura y Software Libres entre todos
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
More information about the Ubuntu-ar
mailing list