[ubuntu-ar] PDFs de imagenes con OCR
Federico Gazaba
federico_gazaba at hotmail.com
Fri May 21 04:27:40 BST 2010
> Hola a todos, estoy digitalizando documentos (textos) con un scaner, con XSane y los guardo como imagenes, pero quer?a hacer un pdf con ellos, con opci?n de b?squeda, el acrobat (creo que el 9) permite hacer el OCR de las imagenes del documento y si bien al abrir el documento pdf uno esta mirando las imagenes se puede realizar b?squedas, incluso seleccionar parte del texto y copiar y pegar luego en otro documento. Tambi?n el software que adjuntan los scaners Kodaks permiten hacer este tipo de PDF. Conocen alguna herramienta similar para linux o forma de hacer este tipo de documentos.
>
> Desde ya muchas gracias
> Alberto
>
Hola alberto, hace unos dÃas mi jefe me preguntó si conocÃa algún
programa para pasar a texto desde una página escaneada. Nunca habÃa
necesitado ninguno de estos programas asà que me puse a buscar en
synaptic. Es verdad lo que dice Román sobre lo complejo que es poder
usar los programas ocr que disponemos en linux porque la mayorÃa son
desde consola. Igualmente pude pasar algunas imágenes a texto con cierta
dificultad porque el escaneado no estaba muy limpio y prolijo que
digamos...
Ahora bien, yendo al grano: buscando en google encontré uno que se llama
gorc y que funciona a modo consola pero también tiene un GUI (modo
gráfico) que no es muy bonito pero si es funcional: gorc-tk. La versión
que tengo es la 0.46 y no recuerdo si ya estaba en synaptic o si lo
descargué desde la web del proyecto gorc.
No pasa de pdf a texto, pero sà te toma imágenes png, gif y muchas otras
más. Además el programa permite configurar ciertas variables para que
reconozca mejor el texto.
Para que veas qué es lo que puede hacer este ocr le tomé un pantallazo
al texto original de este mensaje y lo procesé sin toquetear nada. Quedó
asÃ:
> Hola a todos. estoy digitalizando documentos (textost con un scaner. con XSane y los guardo como imagenes. pero quer3a
> hacer un pdf con ellos. con opci3n de b3squeda. el acrobat (creo que el 9t permite hacer el 0CR de las imagenes del
> documento y si bien al abrir el documento pdf uno esta mirando las imagenes se puede realizar b3squedas. incluso
> seleccionar parte del texto y copiar y pegar luego en otro documento. Tambi3n el software que adjuntan los scaners Kodaks
> permiten hacer este tipo de PDF. Conocen alguna herramienta similar para linux o forma de hacer este tipo de documentos.
>
> Desde ya muchas gracias
> Alberto
Ojalá te sirva mi experiencia. Suerte!
-.Federico Javier Gazaba.-
Profesor de matemática
web: www.arcadematematica.com.ar
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: https://lists.ubuntu.com/archives/ubuntu-ar/attachments/20100521/e21700a0/attachment.htm
More information about the Ubuntu-ar
mailing list