Внимание! Фотоконкурс!

Фотоконкурсу дан старт!

Всем сюда - Фотоостров

Входите под учёткой 101tema, или регистрируйтесь, если вы новый участник!

И добавляйте свои конкурсные работы!

ABBYY FineReader 10

Изображение пользователя Filberd.

Сравнительно недавно я узнал о новой версии ABBYY FineReader, уже десятой по счету. Если учесть, что у меня в производстве непрерывно работают несколько копий 5-й версии, а наша система, занимающаяся мониторингом СМИ и интернета и определением смысла написанных материалов, имеет словарь, основанный на ABBYY Morphology Engine, мне стало интересным на нее посмотреть. Да и словари ABBYY Lingvo, начиная с седьмой версии, быстренько выдавив несколько других, купленных в конце 90-х, есть на всех моих компьютерах. Сейчас практически ежедневно пользуюсь версией с любопытным названием х3. Доволен :о)

Про ABBYY и ее FineReader я узнал где-то в самом начале 90-х, увидев на выставке Comtek одетых в яркие скоморошьи одеяния людей, которые зазывали на стенд фирмы посмотреть самую первую версию. Но тогда услуги OCR (Optical Character Recognition - оптическое распознавание символов) были мне не интересны, и я запомнил только само действо, которое по тем временам было еще в новинку :о))

С тех пор Comtek уже тихо скончался, а  FineReader - живее всех живых.

Впервые я купил  ABBYY FineReader номер 4 в 1998 году, когда начинал делать самую первую версию своей системы смыслового поиска. Четверка ничего, кроме неудовольствия, не вызвала - и кривовата была, и падала... Но замечу, что она, тем не менее, была лучшей среди подобных. Перед покупкой протестировал ряд конкурентов, как российских, так и зарубежных - и купил четверку :)

Потом был кризис...

И к реальному построению системы довелось вернуться уже в 2001 году, когда в июле, точно так же протестировав все, что было на рынке, купил сначала одну коробку  5-й версии, и затем в течение пары недель - еще три. Так они у меня по сей день и трудятся, переходя с компьютера на компьютер, от одного исполнителя к другому, работая на распознавании очень сложных для этой цели бумажных СМИ, прежде всего, журналов ИТ-тематики.

Потом появлялись другив версии ABBYY FineReader...

Тестировал каждую из них и забывал безо всякого желания не только купить, но и даже оставить ее на диске. Для моих конкретных целей все они были малопригодны из-за непонятно зачем усложнявшегося интерфейса, требований к железу и, особенно, к дисковой памяти. А так как у меня нет и не будет никакого желания ставить дорогущие серверы хранения ради несложной и не особо выгодной задачи сканежки/распознавания только из-за того, что программеры ABBYY поленились решить задачу регулируемого качества хранимых файлов-картинок, заявляя, что де дисковая память денег сейчас не стоит, то и вопрос смены лошадки быстро решался в сторону старой доброй Пятерки :о))

Потом была 9-я версия. Мне ее привезли в коробке на следующий день после моего пожелания ее потестить. Коробка смотрелась красиво! :о))

Эта версия задержалась у меня на диске, но только потому, что она уже умела распознавать формат PDF, что мне иногда требовалось уже для личных целей. Все остальное - мне не пригодилось, так как для именно моих целей интерфейс был излишне перегружен и странно ненастраиваем так, как давно принято у других производителей офисного софта, когда можно легко и просто собрать те тулбары, которые нужны именно тебе.

Но для тех, кому надо сделать 1-2 странички в неделю, то есть для основного контингента потребителей - Девятка уже стала чем-то интересным. Особенно с учетом того, что она уже вполне прилично сохраняла тот вид документа, который воспроизводила.

И вот Десятка. Получил ее уже не в коробке, а в виде доступа к FTP. Что ж, так даже удобнее - проще хранить, быстрее инсталлировать :о))

Замечу, что слово "быстрота" как-то у меня с Десяткой срослось довольно быстро. PDF-ы распознает заметно быстрее 9-й,  интерфейс, хоть и по прежнему непонятно зачем такой сложный и ненастраиваемый, быстрее в освоении, обработка сканов, хоть и не совсем быстрая, но все-таки быстрее и гибче 9-ки.

Соответственно, поработав с ней какое-то время, могу сказать - это уже тот продукт, который Must Have в любой конторе, где надо готовить документы со сканов или фото, а также у студентов, которые, сфотографировав нужные странички в учебниках или иных книгах, быстро подготовят курсовую или иную работу.

Если бы не мои чисто профессиональные капризы, никому из читателей не интересные, то и у меня остались бы только положительные впечатления о новом и весьма удачном продукте  ABBYY FineReader 10.

Так что - приятной и полезной покупки тем, кому OCR позволит выполнить желаемое. Ну или требуемое - в зависимости от того, кто для чего будет использовать Десятку!

 

Комментарии

Изображение пользователя Blind.

А не сверял,

А не сверял, насколько улучшалось качество распознавания документов от версии к версии, распознавание форматирования текста, таблиц?

Сам сейчас иногда пользую 7ку для разовых задач.

Изображение пользователя Nikolai Dokuchaev.

А как же,

А как же, сверял. На моих задачах - распознание журналов сплошняком, от обложки до обложки - 5-ка лучше всех.

У нее распознавалка очень удачная.

7, 8 и 9 - вообще не возбудили в сравнении. Практически везде медленнее и слабее. 

А вот 10-ка уже почти не проигрывает на журналах и весьма хороша на всех обычных задачах.

То есть OCR - на хорошо как минимум, а сохранение внешнего вида - на отлично.