Распознавание текста

Руководства, инструкции, советы и хитрости
Ответить
kostaval
Сообщения: 33
Зарегистрирован: 04 окт 2012, 20:43
Темы: 8
Статус: Не в сети

Распознавание текста

Сообщение kostaval » 07 ноя 2012, 19:50

Понадобилось в офисе распознавание текста. За основу взято http://habrahabr.ru/post/153617/
там все отлично разжевано. Tesseract брал версии 3.02, к нему есть огромное количество языков, на которых он может распознавать. От себя добавлю, что тестировал yagf+tesseract+cuneiform при этом тессеракт показал значительно лучший результат, особенно заметно было на украинском языке и латинице. кунеиформ упорно косячил с символом i воспринимая его как 1, да и во многом другом тоже. если поставить в дополнение к aspell пакет с нужным языком, например aspell-ru, aspell-en, aspell-uk, то yagf сразу будет проводить проверку орфографии в связке с тессерактом.
для получения изображения со сканера должен быть установлен xsane.

Ответить

Кто сейчас на конференции

Сейчас этот форум просматривают: Yandex [Bot] и 0 гостей