6 апреля 2015

Автоматизированная подборка: появятся ли новые требования к оцифровке документов?

Владимир Алеев Результатом оцифровки должен стать максимально   структурированный и формализованный информационный ресурс, с помощью которого будут сокращены  временные  затраты на выполнение профильных функций и повысится эффективность деятельности  подразделений.

На информацию из документации исходноразрешительного характера опираются функциональные специалисты при подготовке документов градостроительного проектирования, в  том числе  градостроительных планов земельных участков, проектов планировки территории и др. Деятельность органа управления земельно-имущественным комплексом (инвентаризация, учёт, приватизация, аренда, передача/принятие) также основывается на соответствующей информации, которая содержится в документах.

Для обеспечения специалистов инструментом оперативного получения сведений, как правило, создаётся система, представляющая собой банк данных документов  с  поисковой формой, с помощью которой при вводе набора реквизитов можно получить результат в виде одного или нескольких документов, соответствующих запросу. Для разных массивов      документов конструируются разные поисковые формы, подстроенные под набор индексных полей. Документы могут быть проиндексированы по минимальному количеству полей для поиска по номеру, или же будет проведено полное индексирование для осуществления сквозного поиска.

Как снизить расходы на ретроконверсию, если требуется  индексировать документы по нескольким десяткам полей?

Какие услуги требуются от исполнителя при исполнении контрактных обязательств на оцифровку документации земельно-имущественного или градостроительного комплекса? Например, перед органом управления градостроительством крупного российского субъекта встала задача наполнить информационную    систему    сведениями о документах для решения вопросов, в т.ч. судебного характера, связанных с выявлением объектов самостроя. Массив — более 1500 дел, содержащих десятки документов. Требуется  провести  их  сканирование и индексирование более чем по сорока полям: тип документа, номер дела, дата утверждения документа, наименование объекта, категория строительства, тип строительства, номер и дата регистрации в Градостроительном кадастре, территория, заказчик, проектировщик и так далее.

Другой случай: в органе управления имуществом региона для решения множества задач различными подразделениями востребованы 17 млн документов  30-ти  типов,  создававшихся в течение долгого времени. Органу управления будет необходимо спрогнозировать некий оптимальный набор индексных полей, что крайне сложно, — архив документов можно сделать универсальным только при условии избыточного индексирования. И заказчик на определенном этапе ограничивается созданием электронных образов своих 17 млн документов, поскольку расходы на ретроконверсию оказываются слишком велики.

Интерфейс рабочего места сотрудника будет состоять из строки поиска и трёх кнопок — «Документы по аренде», «Документы на объект», «Арендатор»

Расходы на индексирование нужно свести к минимуму, а результатом создания цифрового ресурса должен стать автоматический отбор документов и их оперативная консолидация в рамках рабочего места конкретного функционального  специалиста.

Альтернативой традиционному подходу посозданиюэлектронногоинформационного ресурса   документов   градостроительного и земельно-имущественного комплексов является использование автоматизированной системы подборки документов (АСПД). Неструктурированный цифровой массив в виде сканобразов документов загружается в систему, которая осуществляет черновое распознавание без верификации. Затем АСПД по заданным классификаторам и набору регулярных      выражений определяет принадлежность документа к определённому типу. Для каждого из типов документов запрограммирован вполне конкретный набор реквизитов, необходимых для включения  на  их  основе  в оперативные подборки, и из документов на основании той же распознанной подложки извлекаются индексные данные и связываются с документами. Наименования документов не формализованы, и система распознает близкие по значению слова, например, «договор», «контракт», «соглашение». Система взаимодействует через программный интерфейс (API) с любым источником, содержащим документы, — СЭД, ECM, файловой системой. Технология обработки информации позволяет определять словоформы, выявлять различные сущности в тексте (производится с использованием словарей и/или правил употребления слов, например с большой вероятностью слово с заглавной буквы, стоящее после аббревиатуры ОАО, является названием организации): наименование организаций, название улиц, номера домов и т. д.

Если бумажным прототипом массива был набор папок (номенклатурных дел), то единицей обработки  в  АСПД  будет  дело. При определении типа страницы, система делает логическую «закладку» с привязанными к ней параметрами этого документа и выделенными индексными полями, кото рая, по сути, является карточкой  документа,  отмеченного этой «закладкой». Неструктурированный массив в результате обработки системой превращается в формализованный электронный информационный ресурс. В результате запроса, который  осуществляется в универсальном поисковом поле, система самостоятельно распознает формат и содержание запроса, проассоциирует их с адресом или наименованием юридического лица, кадастровым или условным номером, датой договора аренды и т.п. На интерфейсе рабочего места специалиста органа управления имуществом помимо строки поиска будет всего три кнопки — «Документы по аренде», «Документы на объект» и «Арендатор». Специалисты смогут оперативно формировать подборки документов по наименованию юридического лица, фрагменту адреса нахождения объекта, условного или кадастрового номера, номера договора аренды. Всякий раз, когда у подразделения администрации появится необходимость наполнить систему новыми документами, они после оцифровки будут также автоматически обрабатываться и окажутся включенными в процессы обеспечения деятельности отделов.

Интерфейс рабочего места сотрудника органа управления градостроительным комплексом  будет  состоять  из  строки  поиска и трех кнопок — «Разрешительная документация»,   «Проектная   документация» и «Нормативная документация». Подбор осуществляется соответственно: по кадастровому номеру, почтовому или строительному адресу; территории, периоду и проектировщику; наименованию органа, принявшего нормативный  акт.

Помимо типов формализованных документов, массив будет содержать также сопутствующие квитанции об отправке заказных писем, судебные уведомления и т. д. Создавать глобальный справочник, учитывая и эти типы документов, нецелесообразно. Расставленные закладки дают возможность осуществлять прямой доступ к документу, а просмотрщик — «пролистать» не только этот документ, но и близкие к нему.

Таким образом, автоматизированная система подборки документов позволяет решать не только типовые задачи, но и любые новые, становясь универсальным инструментом управления градостроительным или земельно-имущественным комплексом региона или муниципалитета.

Рубрика: Тенденции