Cистема оптического распознавания текстов
Pivushkov Alexandr
pav на icp.ac.ru
Ср Дек 1 12:35:50 GMT 2010
slava пишет:
> On 01.12.2010 14:08, Daniil Bd wrote:
>> Всем здравствуйте. Нужно распознать текст со сканированной страницы.
>> Грубо говоря, перевести картинку с буквами в текст для дальнейшей
>> работы на компьютере. Собственно вопрос, существует ли система
>> распознавания текстов под Linux?
Существуют, но реально с ними можно только "поиграться".
Удалось хоть что то получить, похожее на результат из связки
OCRFeeder+Cuneiform, насколько я не помню :), пришлось из исходников
собирать и править команду в OCRFeeder-е: Tools -> OCR Engines ->
Cuneiform на такую: "-l rus -f text -o $FILE $IMAGE > /dev/null 2>
/dev/null && cat $FILE && rm $FILE"
Наилучший результат получился с рисунком в формате BMP
Если нужен только чисто текст без форматирования то, по моему мнению,
оптимально - командная строка - сuneiform.
>> Благодарю.
> http://www.onlineocr.ru/
туда же:
http://finereader.abbyyonline.com/en/Account/LogOn?ReturnUrl=%2fru%2fTask%2fQueue
http://www.free-ocr.com/
http://googlecodesamples.com/docs/php/ocr.php
https://www.ocrterminal.com/dashboard/?display_last=1
http://cunewebform.nntc.nnov.ru/
https://my.ocrnow.com/account/login
http://www.newocr.com/
--
- Пивушков Александр. Институт проблем химической физики. Черноголовка.
Подробная информация о списке рассылки ubuntu-ru