ABBYY Recognition Server предоставляет сервисы OCR

Во всем мире растет культура документооборота. Для любого бизнеса важно держать архивы документов в аккуратном состоянии, а это зачастую требует значительных затрат. Во многих случаях, когда необходимо автоматизировать обработку документов, принимается решение о приобретении должного количества принтеров, МФУ, сканеров. Однако ощутимого эффекта в этом процессе можно достичь, если задействовать специализированное ПО.

Сегодня можно выделить несколько задач, которые нужно решать в крупных организациях. Это может быть создание электронного архива документов - для каждого экземпляра делается JPEG-копия и специальная текстовая марка (xml-tickets), содержащая поля с ключевыми характеристиками. Но может понадобиться и простая сортировка - все входящие документы делятся по типу (счета, договора) и рассылаются по назначению. При достаточном почтовом потоке традиционной почтовой переписки может быть полезным вести электронную базу адресов. В общем, есть много различных задач, для решения которых необходимо распознавание текста.


Четыре основных компонента ABBYY Recognition Server позволяют создать гибкое
клиент-серверное решение, ориентированное на предоставление сервисов OCR

Пытаясь обеспечить возможность выполнения этих задач, крупные корпорации сталкиваются со сложностью интеграции специализированного ПО. Эта проблема является типовой и решается с помощью внедрения программ с клиент-серверной ориентацией. Именно для организации крупных распределенных компьютерных систем обработки документов и предназначена передовая разработка компании ABBYY Recognition Server. Основная его задача — это предоставление сервисов OCR, которые могут быть независимо задействованы третьим ПО. Важной функцией данного сервера является его масштабируемость - при необходимости производить большое количество распознаваний в единицу времени, может быть сгруппировано неограниченное количество компьютеров.

Сам программный комплекс включает в себя четыре важных компонента. Сервер-менеджер управляет всеми запросами, производит балансировку нагрузки, контролирует задаваемые опции. Станции обработки непосредственно занимаются распознаванием текста. Причем необходимые образы они получают от сервер-менеджера. Удаленная консоль администрирования является оснасткой стандартной MMC и служит для полного контроля и управления системой. В системе имеется возможность задать несколько учетных записей с правами административного управления. И самая интересная часть — это открытый интерфейс разработчика (Open API), позволяющий интегрировать общую функциональность Recognition Server со специализированными программами.


При создании бизнес-процессов администратор имеет возможность придавать им свойства,
позволяющие добиться наиболее приемлемого результата работы

Сама схема реализации этого программного комплекса выглядит следующим образом. На одном или нескольких компьютерах устанавливаются компоненты: сервер-менеджер и модуль, реализующий OCR. Далее с помощью консоли управления создается ряд бизнес-процессов (Workflow). Каждая Workflow имеет набор свойств, устанавливая которые можно задать необходимую логику работы сервера. Одним из ключевых свойств Workflow есть набор папок. Для каждого процесса их три - входящая, исходящая и папка исключений. Ко всем из них должен быть предоставлен сетевой доступ. Теперь любая рабочая станция имеет возможность записать во входящую папку файлы-образы. Они будут подхвачены системой, отработаны и в зависимости от уровня успеха этой операции в соответствующем виде помещены в исходящую папку или в папку исключений. Кстати поток входящих образов может быть организован не только по сети Windows, но и через протокол FTP или е-mail.

Управляя настройками бизнес процессов, администратор имеет возможность задавать способ обработки заданий - немедленно после поступления или по расписанию. Последний способ часто используют, когда есть желание перенести ресурсоемкую процедуру OCR на нерабочее время. Также каждому бизнес процессу может быть присвоен один из пяти приоритетов выполнения. Кроме автоматического выбора языка, можно вручную указать лингвистические характеристики документов, чтобы, например, увеличить скорость обработки. Сервер имеет продвинутые возможности манипулирования именами выходных файлов. Это может быть полезно, если задействовать скриптовые сценарии для сортировки результатов работы. Кроме того, есть широкий выбор типа получаемых результатов. Это могут быть все виды документов MS Office, pdf-файлы и другие.

Важно, что в папке результатов вместе с самими обработанными документами помещается еще и марка каждого документа в формате xml. В ней содержаться все важные характеристики каждого задания, они могут понадобиться в дальнейшем для последующей обработки.

Для чего может быть использовано данное серверное решение? В первую очередь, Recognition Server предназначен для софтверных компаний, желающих разрабатывать системы документооборота под ключ для третьих лиц. Поэтому данный продукт нужно рассматривать как соответствующий API.

Достоинства: гибкая архитектура, поддержка широкого набора форматов, возможность адаптации к различным сетевым протоколам.
Недостатки: не обнаружено.
Резюме: мощное сетевая платформа для сервисов OCR.

— Николай Ткаченко

2006.11.12
19.03.2009
В IV квартале 2008 г. украинский рынок серверов по сравнению с аналогичным периодом прошлого года сократился в денежном выражении на 34% – до $30 млн (в ценах для конечных пользователей), а за весь календарный год – более чем на 5%, до 132 млн долл.


12.03.2009
4 марта в Киеве компания Telco провела конференцию "Инновационные телекоммуникации", посвященную новым эффективным телекоммуникационным технологиям для решения задач современного бизнеса.


05.03.2009
25 февраля в Киеве компания IBM, при информационной поддержке "1С" и Canonical, провела конференцию "Как сохранить деньги в условиях кризиса?"


26.02.2009
18-19 февраля в Киеве прошел юбилейный съезд ИТ-директоров Украины. Участниками данного мероприятия стали ИТ-директора, ИТ-менеджеры, поставщики ИТ-решений из Киева, Николаева, Днепропетровска, Чернигова и других городов Украины...


19.02.2009
10 февраля в Киеве состоялась пресс-конференция, посвященная итогам деятельности компании "DiaWest – Комп’ютерний світ" в 2008 году.


12.02.2009
С 5 февраля 2009 г. в Киеве начали работу учебные курсы по использованию услуг "электронного предприятия/ учреждения" на базе сети информационно-маркетинговых центров (ИМЦ).


04.02.2009
29 января 2009 года в редакции еженедельника "Computer World/Украина" состоялось награждение победителей акции "Оформи подписку – получи приз!".


29.01.2009
22 января в Киеве компания "МУК" и представительство компании Cisco в Украине провели семинар для партнеров "Обзор продуктов и решений Cisco Small Business"

 

 
 
Copyright © 1997-2008 ИД "Комиздат".