[ubuntu-ar] Soft OCR

Miguel Sajnovsky miguel.sajnovsky at ubuntu.com
Wed Mar 24 01:23:15 GMT 2010


El 23 de marzo de 2010 20:07, Jorge Fabián San Román <
jsanroman en digisis.com.ar> escribió
>
>
>
> Hola, bueno, a ver si puedo ayudar, yo también estoy interesado en OCR,
> probé
> el Xsane que usa gocr de motor y tiene demasiados errores; pero buscando
> encontré esta guía:
>
> Primero instar los paquetes "tesseract 2.03-4" de
> "http://download.tuxfamily.org/xcfaudio/tesseract/All%20languages/i386/",
> "xsane2tess" de "http://download.tuxfamily.org/guadausers/guadaV4/" y
> "imagemagick".
>
> Luego crear la carpeta tmp en: /home/usuario/tmp
>
> Después abrir Xsane para configurarlo, Preferencias--> Configuración-->
> pestaña OCR y relleno lo siguiente:
>
> Orden OCR --> xsane2tess -l spa
> Opción del archivo de entrada --> -i
> Opción del archivo de salida --> -o
> Opción de salida-fd de interfaz --> -x
>
> Aclaro que no lo pude usar porque el xsane2tess que encontré es de i386 y
> mi
> sistema es X64, pero seguí buscando y encontré una interfaz gráfica para
> Tesseract aquí: http://sourceforge.net/projects/tesseract-gui
>
> esta sí me funcionó, pero escaneo el texto como imágen Tiff, guardo el
> archivo, despúes desde Tesseract-GUI lo busco, lo abre y lo guarda como TXT
> y
> allí lo trabajo con Open Office; tiene pocos errores.
>
> Espero haber sido de utilidad. Saludos.
> > --
>
-- 


Me hiciste derramar una lagrima en el teclado, en serio.

Todavia no respondieron desde Cordoba pero me parece que te mandan un disco
de NIN de regalo
_______________
Miguel Sajnovsky
www.twitter.com/sajnox
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: https://lists.ubuntu.com/archives/ubuntu-ar/attachments/20100323/34e667e9/attachment.htm 


More information about the Ubuntu-ar mailing list