Блог Андрія Огороднікова Хто з мечем до нас прийде, від меча й загине.

CuneiForm — альтернатива FineReader

17.04.2017, 05:22

Сказавши А, надобно сказать и что-то еще.

Давно прошло то время, когда, поставив и заюзав крякнутый софт, чувствовал себя победителем. Нынче же, когда случается необходимость использования такого программного обеспечения, появляется чувство, если не брезгливости, то дискомфорта. Еще десять лет назад наполнение системы начиналось с ввода десятков стыренных серийников, задействования крэков и патчей, не говоря уж о самой системе…

Поэтому вчера, вынужденно используя коммерческий продукт, я испытывал чувство досады, пока не вспомнил о бесплатной (даже open source) альтернативе.

Около 8 лет назад открылся исходный код программы CuneiForm («клинопись») и она стала бесплатной, правда на этом разработка ее прекратилась, но это ни о чем еще не говорит. Как показывает в т.ч. вчерашняя практика — старое не означает плохое, скорее даже наоборот.

cuneiform

Оказалось, что я сам давным-давно делал портативную версию этой программы и в архивах нашел таковую. Продукт 2007 года, если подумать, не такое уж и старье, хотя есть любители сверхновых версий, у которых установка свежака неостановима. А потом они же ноют на разных форумах: «а как мне откатиться на старую версию???».

Итак, программа работает, текст видит. Сложный пример (с углом, дисторсией и скромным контрастом), который я задействовал вчера, полностью по зубам CuneiForm не оказался, но результат не хуже (если не лучше), чем выдала 12 версия Файнридера. 8-й оказался вне конкуренции. Зато с отсканированными контрастными и четкими страницами проблем не возникло, и CF сработала даже быстрее чем 8-й FR. При том же качестве распознавания.

То есть, если существует принципиальный момент, не позволяющий использовать 8-й ФайнРидер, то альтернатива вполне полноценна, если не ставить экстремальных задач. Нормально напечатанную и отсканированную с разрешением в 300 dpi книгу ничто не помешает распознать.

Ссылка на официальный сайт разработчика.
Существуют варианты и под линукс на основе, но движуха остановилась в 2011 году, не знаю, что там и как работает.