Cистема оптического распознавания текстов

Ср Дек 1 12:35:50 GMT 2010

slava пишет:
> On 01.12.2010 14:08, Daniil Bd wrote:
>> Всем здравствуйте. Нужно распознать текст со сканированной страницы. 
>> Грубо говоря, перевести картинку с буквами в текст для дальнейшей 
>> работы на компьютере. Собственно вопрос, существует ли  система 
>> распознавания текстов под Linux?
  Существуют, но реально с ними можно только "поиграться".

  Удалось хоть что то получить, похожее на результат из связки 
OCRFeeder+Cuneiform, насколько я не помню :), пришлось из исходников 
собирать и править команду в OCRFeeder-е:  Tools -> OCR Engines -> 
Cuneiform на такую: "-l rus -f text -o $FILE $IMAGE > /dev/null 2> 
/dev/null && cat $FILE && rm $FILE"
  Наилучший результат получился с рисунком в формате BMP

  Если нужен только чисто текст без форматирования то, по моему мнению, 
оптимально - командная строка - сuneiform.

>> Благодарю.
> http://www.onlineocr.ru/

туда же:
http://finereader.abbyyonline.com/en/Account/LogOn?ReturnUrl=%2fru%2fTask%2fQueue
http://www.free-ocr.com/
http://googlecodesamples.com/docs/php/ocr.php
https://www.ocrterminal.com/dashboard/?display_last=1
http://cunewebform.nntc.nnov.ru/
https://my.ocrnow.com/account/login
http://www.newocr.com/

-- 
- Пивушков Александр. Институт проблем химической физики. Черноголовка.