|
Фотоконкурсу дан старт! Всем сюда - Фотоостров |
Входите под учёткой 101tema, или регистрируйтесь, если вы новый участник! И добавляйте свои конкурсные работы! |

Сравнительно недавно я узнал о новой версии ABBYY FineReader, уже десятой по счету. Если учесть, что у меня в производстве непрерывно работают несколько копий 5-й версии, а наша система, занимающаяся мониторингом СМИ и интернета и определением смысла написанных материалов, имеет словарь, основанный на ABBYY Morphology Engine, мне стало интересным на нее посмотреть. Да и словари ABBYY Lingvo, начиная с седьмой версии, быстренько выдавив несколько других, купленных в конце 90-х, есть на всех моих компьютерах. Сейчас практически ежедневно пользуюсь версией с любопытным названием х3. Доволен :о)
Про ABBYY и ее FineReader я узнал где-то в самом начале 90-х, увидев на выставке Comtek одетых в яркие скоморошьи одеяния людей, которые зазывали на стенд фирмы посмотреть самую первую версию. Но тогда услуги OCR (Optical Character Recognition - оптическое распознавание символов) были мне не интересны, и я запомнил только само действо, которое по тем временам было еще в новинку :о))
С тех пор Comtek уже тихо скончался, а FineReader - живее всех живых.
Впервые я купил ABBYY FineReader номер 4 в 1998 году, когда начинал делать самую первую версию своей системы смыслового поиска. Четверка ничего, кроме неудовольствия, не вызвала - и кривовата была, и падала... Но замечу, что она, тем не менее, была лучшей среди подобных. Перед покупкой протестировал ряд конкурентов, как российских, так и зарубежных - и купил четверку :)
Потом был кризис...
И к реальному построению системы довелось вернуться уже в 2001 году, когда в июле, точно так же протестировав все, что было на рынке, купил сначала одну коробку 5-й версии, и затем в течение пары недель - еще три. Так они у меня по сей день и трудятся, переходя с компьютера на компьютер, от одного исполнителя к другому, работая на распознавании очень сложных для этой цели бумажных СМИ, прежде всего, журналов ИТ-тематики.
Потом появлялись другив версии ABBYY FineReader...
Тестировал каждую из них и забывал безо всякого желания не только купить, но и даже оставить ее на диске. Для моих конкретных целей все они были малопригодны из-за непонятно зачем усложнявшегося интерфейса, требований к железу и, особенно, к дисковой памяти. А так как у меня нет и не будет никакого желания ставить дорогущие серверы хранения ради несложной и не особо выгодной задачи сканежки/распознавания только из-за того, что программеры ABBYY поленились решить задачу регулируемого качества хранимых файлов-картинок, заявляя, что де дисковая память денег сейчас не стоит, то и вопрос смены лошадки быстро решался в сторону старой доброй Пятерки :о))
Потом была 9-я версия. Мне ее привезли в коробке на следующий день после моего пожелания ее потестить. Коробка смотрелась красиво! :о))
Эта версия задержалась у меня на диске, но только потому, что она уже умела распознавать формат PDF, что мне иногда требовалось уже для личных целей. Все остальное - мне не пригодилось, так как для именно моих целей интерфейс был излишне перегружен и странно ненастраиваем так, как давно принято у других производителей офисного софта, когда можно легко и просто собрать те тулбары, которые нужны именно тебе.
Но для тех, кому надо сделать 1-2 странички в неделю, то есть для основного контингента потребителей - Девятка уже стала чем-то интересным. Особенно с учетом того, что она уже вполне прилично сохраняла тот вид документа, который воспроизводила.
И вот Десятка. Получил ее уже не в коробке, а в виде доступа к FTP. Что ж, так даже удобнее - проще хранить, быстрее инсталлировать :о))
Замечу, что слово "быстрота" как-то у меня с Десяткой срослось довольно быстро. PDF-ы распознает заметно быстрее 9-й, интерфейс, хоть и по прежнему непонятно зачем такой сложный и ненастраиваемый, быстрее в освоении, обработка сканов, хоть и не совсем быстрая, но все-таки быстрее и гибче 9-ки.
Соответственно, поработав с ней какое-то время, могу сказать - это уже тот продукт, который Must Have в любой конторе, где надо готовить документы со сканов или фото, а также у студентов, которые, сфотографировав нужные странички в учебниках или иных книгах, быстро подготовят курсовую или иную работу.
Если бы не мои чисто профессиональные капризы, никому из читателей не интересные, то и у меня остались бы только положительные впечатления о новом и весьма удачном продукте ABBYY FineReader 10.
Так что - приятной и полезной покупки тем, кому OCR позволит выполнить желаемое. Ну или требуемое - в зависимости от того, кто для чего будет использовать Десятку!
Комментарии
А не сверял,
А не сверял, насколько улучшалось качество распознавания документов от версии к версии, распознавание форматирования текста, таблиц?
Сам сейчас иногда пользую 7ку для разовых задач.
А как же,
А как же, сверял. На моих задачах - распознание журналов сплошняком, от обложки до обложки - 5-ка лучше всех.
У нее распознавалка очень удачная.
7, 8 и 9 - вообще не возбудили в сравнении. Практически везде медленнее и слабее.
А вот 10-ка уже почти не проигрывает на журналах и весьма хороша на всех обычных задачах.
То есть OCR - на хорошо как минимум, а сохранение внешнего вида - на отлично.