CuneiForm - упрощенный аналог Finereader
Заниматься сканированием и распознаванием текста мне еще не приходилось. Хотя, как и большинство пользователей, ради интереса я запускал Fine Reader.
Но! Я большой любитель бесплатного альтернативного ПО и не мог пройти мимо новости о том, что компания Cognitive Technologies с 12 декабря 2007 года открыла исходные коды своей программы для распознавания текста - OCR CuneiForm.
Мне стало интересно попробовать, на что же способна программа. Поскольку сканера у меня нет, то я скачал Demo-версию седьмого Fine Reader-a и вытянул из него tiff картинки, которые используются для демонстрации работы приложения.
Да не прокручивайте вы вниз, сразу к картинкам! Почитайте еще чуть-чуть. 
Программа поддерживает не только русский, украинский и английский языки, но также и большинство популярных европейских языков (более 2 десятков). Умеет искать таблицы и картинки, и при этом работает очень быстро. На распознавание тестовой странички ушло не более 5 секунд.
Полученный документ можно сохранить в формате .rtf .htm .txt , а также напрямую передавать в приложения Word и Excel.
CuneiForm поддерживает импорт большинства графических файлов (.bmp .jpg .tiff .png). Имеет удобный и несложный мастер, которым я и пользовался для проверки качества распознавания.

В качестве тестового задания программе была предложена картинка с таблицей, изображениями и текстом, в котором содержались как русские, так и английские слова.
Я специально не выискивал, но кажется CuneiForm справился с заданием на отлично. 95-99% документа распознанно верно.
Скачать можно здесь. (33.3 MB)
читать дальше »