От выбора системы OCR напрямую зависят финансовые показатели бизнеса, так как правильно настроенное решение позволяет снижать операционные издержки, фонд оплаты труда и быстрее получать точные данные для дальнейшей работы компании.
От архивов до общих центров обслуживания – везде, где компании имеют дело с большим объемом разрозненных документов, системы оптического распознавания символов (OCR) могут качественно изменить подход к обработке данных. На фоне выхода продуктов ABBYY из единого реестра российского ПО мы решили рассмотреть, какие альтернативы есть у тех, кто продолжает пользоваться технологиями OCR.
Технология оптического распознавания символов (Optical Character Recognition, OCR) позволяет извлекать данные из документов самых разных типов – от текстовых и PDF до фотоизображений. Получая их, мы можем структурировать данные, обеспечить быстрый поиск информации и передачу обработанных данных в бизнес-системы компании.
OCR Form
При большом объеме входящей документации использование OCR актуально для кадровой службы, бухгалтерского или юридического отдела, архива. А также для общих центров обслуживания (ОЦО), которые все чаще создаются в крупных компаниях, работающих с массовым рынком.
Но OCR работает не только с бумажными версиями файлов: решения на базе этой технологии обрабатывают цифровые образы документов. В таком случае образ извлекается не в процессе сканирования, а передается из других систем, в том числе через системы электронного документооборота (ЭДО). Для ряда заказчиков этот сценарий актуален.
Например, банки принимают кредитные анкеты из розничных сетей, а коллекторские агентства – договоры между банками и их должниками. Во всех подобных случаях OCR позволяет автоматизировать и повысить эффективность процесса извлечения данных. Кроме того, растет интерес к технологии OCR в государственных организациях.
Однако к решениям на ее основе, как и ко многим другим, здесь предъявляют особое требование: они должны обязательно входить в реестр российского ПО. К настоящему времени таких решений в нем немало и с каждым годом становится все больше. От выбора системы OCR напрямую зависят финансовые показатели бизнеса, так как правильно настроенное решение позволяет снижать операционные издержки, фонд оплаты труда и быстрее получать точные данные для дальнейшей работы компании. Лишь на первый взгляд распознавание с точностью 75% незначительно отличается от 98%-ной, а на практике такая разница увеличивает количество обрабатываемых вручную документов с 2 до 25%. Таким образом, выбирая OCR-решение, очень важно не ошибиться.
Три составляющие OCR-решений
«Под капотом» OCR-решений находятся три ключевые составляющие: а) движок распознавания, б) инструменты настройки шаблонов, в) технологии машинного обучения, которые могут использоваться или нет в зависимости от решаемой задачи. Для начала разберемся с движком – это основа технологии распознавания. Практически все крупные системы имеют собственные технологии распознавания.
Так, Google, Amazon и Microsoft предлагают достаточно дешевое облачное полнотекстовое распознавание, однако на русском языке его качество оставляет желать лучшего. Yandex здесь выигрывает, но, в отличие от конкурентов, для него характерны ограничения размера изображений. Что касается промышленных движков, то мы рекомендуем enterprise-решения вроде ABBYY, Tesseract и Kofax.
Применение инструментов настройки шаблонов поверх движков распознавания – это уже уровень интеграции OCR с другими системами компании. Часто на данном этапе требуется написание программного кода для связки решений между собой. За счет программируемых шаблонов можно задать определенный функционал пред- и постобработки изображений, передачи данных из системы в систему.
Проще говоря, могут быть созданы правила и сценарии обработки распознанных данных, которые соответствуют бизнес-процессам конкретной компании. Типичный проект по внедрению решения OCR состоит из двух частей: выбора лицензионного софта (движка) и работы по созданию шаблонов. Обе части влияют на стоимость проекта – чем удобнее инструмент, тем ниже она будет.
При этом реализация шаблонов и интеграции зависит от компании-исполнителя: кто-то использует только свой движок, а кто-то, как Konica Minolta, работает с любым софтом, подбирая решения под задачи заказчика. Наконец, третий уровень OCR-решений – применение поверх движков и шаблонов технологий машинного обучения, машинного зрения и нейросетей. Об этом чуть ниже.
Какие движки OCR доступны российским заказчикам?
Среди наиболее популярных стоит отметить решение ABBYY — продукт на собственном движке, отличающийся «зрелыми» возможностями работы с кириллицей при доступной стоимости. Ключевой конкурент на мировом рынке, продукт от Kofax, несколько более дорогой и менее функциональный для отечественных пользователей из-за особенностей обработки языка.
На российском рынке также встречаются решения на базе IBM DataCap, однако эта система сложнее в настройке и обладает меньшими возможностями, чем первые две, при этом ее цена в некоторых случаях выше. Отдельно упомянем софт, подходящий компаниям, которым необходимо соблюдать требования законодательства об импортозамещении.
Среди таких движков, например, российский SOICA, уже включенный в реестр отечественного ПО. А также платформу EasySeparate, способную использовать любой движок OCR, что позволяет достигать гибкости при внедрении и настройке. Кстати, сейчас идет процесс включения EasySeparate в реестр отечественного ПО.
Кроме того, существуют различные роботизированные решения класса RPA, которые претендуют на работу с распознаванием документов. Но стоит иметь в виду, что системы класса RPA не заточены под сложные случаи работы с извлечением данных, так как их роль в первую очередь состоит в автоматизации бизнес-процессов. Поэтому в проектах, где требуется автоматизировать задачи извлечения данных, RPA зачастую тесно интегрирован с OCR: ведь специализированные OCR-решения могут обеспечить точность распознавания до 99%, особенно при обработке сложных запросов, а в большинстве проектов эта точность служит критерием экономического обоснования и успешности проекта.
С чем интегрируют OCR?
Сама по себе технология OCR – только средство извлечения данных. Важно, для чего мы их получаем и каким образом будем обрабатывать, хранить и передавать дальше в пределах ИТ-инфраструктуры компании. Обычно заказчики хотят получить решения для сквозных процессов, и это правильно.
Поэтому задачи проектов по извлечению данных тесно связаны с роботизацией процессов и теми же RPA: в таком случае OCR и RPA дополняют друг друга. Сюда же относится взаимодействие OCR-решений с электронными архивами, где хранятся цифровые образы документов вместе с метаданными, которые были извлечены из них с помощью распознавания.
Причем под классом электронных архивов подразумевается широкий спектр решений разного уровня сложности. Так, у Konica Minolta есть опыт реализации комплексных электронных архивов в качестве единого централизованного хранилища данных, которое автоматизирует процессы, маршрутизирует документы и связано с ЭДО, но компания работает и с более простыми цифровыми хранилищами в виде понятной структуры папок с упрощенным поиском данных.
На теме поиска нужно заострить внимание: в электронном архиве он существенно упрощается. Поскольку все документы получают текстовый слой, то электронный архив делает весь текст документа индексным. И если раньше вы могли искать только по атрибутам документов, например номеру или дате, то теперь – и по содержимому. Это может быть крайне актуально, когда компании необходимо быстро находить нужные файлы для контрагентов или той же ФНС, часто требующей предоставления информации в электронном виде. Сюда же относится налоговый мониторинг, который через витрины данных предполагает обмен информацией с налоговой службой.
Как развиваются OCR на основе нейросетей?
Наконец, третий уровень OCR-решений – наиболее интеллектуальный. С развитием нейронных сетей и фреймворков стало возможным обучать систему распознавать текст на определенных видах документов, и результат у таких специализированных решений будет выше, чем у универсальных.
Например, решения от SmartEngines показывают высокое качество распознавания на паспортах, так как система была обучена именно на этих документах и учитывает их особенности. Пандемия ускорила переход обработки в облако. Большинство лидеров рынка предлагают именно облачные системы.
Так, ABBYY запустила платформу Vantage, а Microsoft развивает обучение документов в Azure Forms . Обе платформы позволяют подготовить и обучить систему извлечению значимых данных. По сути, классические задачи простой индексации документов, то есть извлечения из них атрибутов, уходят в прошлое. Большинство проектов требуют не просто извлечения, но и детального анализа данных, а также выстраивания взаимосвязей между документами, что не только более ценно для компаний, но еще и упрощает работу в сравнении с классическим подходом. При наличии необходимых инструментов обучение нейросети может выполнить аналитик, а разработку шаблона выполняет только программист.
Что нужно учесть при выборе OCR-системы?
- В первую очередь большое значение имеют возможности движка: он должен хорошо работать с кириллицей, что не все западные решения могут обеспечить. Более того, если компания должна соблюдать требования импортозамещения, ей нужен софт, включенный в единый реестр отечественного ПО.
- Если предполагается распознавание сложных документов, особенно не текстовых, с нестандартным оформлением и структурой, не стоит полностью полагаться на встроенные инструменты решений RPA. Только OCR сможет обеспечить наилучшее качество распознавания данных.
- В большинстве проектов после выбора движка требуется этап разработки шаблонов и интеграции OCR с другими системами, в том числе RPA и электронными архивами. Необходимо учесть совместимость движка и возможности вашего интегратора осуществлять работу с разными типами решений.
- В ряде случаев значительный бизнес-эффект можно получить также от использования вместе с OCR технологий машинного обучения, компьютерного зрения и нейросетей. Этот продвинутый уровень позволяет быстро извлекать и анализировать данные из исходных источников любой сложности.
Источник: www.it-world.ru
Распознавание корпоративных документов: как не утонуть в море бумаг?
Обработка документов — один из самых трудоемких и демотивирующих процессов для сотрудников. Мы подсчитали, что ручной ввод данных из типовых форм занимает 6–7 часов в день. Автономная система Smart Document Engine на смартфоне справляется с подобной задачей буквально за минуты. В этой статье мы расскажем о самых эффективных бизнес‑кейсах применения нашей мобильной OCR.
Когда в вашей компании появляется новый клиент или запустился очередной проект с давним партнером, неизбежно формируется большой объем корпоративных документов. К ним относится вся «первичка»: счета‑фактуры, счета на оплату, платежные поручения; документы бухгалтерской и налоговой отчетности (например, справка о доходах физлица). А кроме того уставные, страховые, нотариальные документы, KYC‑анкеты, согласия на обработку персональных данных и т. д.
Зачастую компании обрабатывают миллионы листов корпоративных документов с помощью планшетного сканера. Сотрудники сканируют документы и переводят их в PDF‑файлы. Поиск нужной информацию в этих копиях иногда превращается в квест.
Нередко банки, государственные компании и госкорпорации привлекают к обработке документов специальные онлайн‑сервисы, которые в свою очередь нанимают операторами распознавания третьих лиц, обычно, самозанятых. В этом случае при несущественных затратах у заказчика возникает серьезный риск утечки данных и угроза мошенничества, за что компания и ее CEO скорее всего будут оштрафованы.
Утечки персональных данных могут обернуться для топ‑менеджеров банков более серьезными последствиями. Центробанк планирует ввести личную ответственность топ‑менеджеров банков за утечки данных, наказывая их «вплоть до дисквалификации».
Более надежно обрабатывать данные в безопасном контуре, не используя внешние сервисы. Распознавание корпоративных документов сейчас можно поручить автономной системе на базе искусственного интеллекта, которая инсталлируется на любое устройство. Последней разработкой в этом классе является программный продукт Smart Document Engine. В декабре команда ученых Smart Engines представила его новую версию.
Если говорить коротко, решение позволяет решить две главных задачи:
- Оцифровка бумажных документов;
- Оптимизация процессов массового ввода документов.
«Газпромбанк», «Росбанк», банк «Синара» и другие компании уже используют систему распознавания деловых документов Smart Document Engine.
Как автономная OCR применяется в банках и МФО?
Наша система помогает банкам улучшить качество обслуживания и увеличить точность, скорость и безопасность своих операций.
Быстрое распознавание справки о доходах физического лица (ранее — 2-НДФЛ) позволяет банкам полностью автоматизировать процесс так называемого «кредитного конвейера». Это система обработки заявок на кредитование и принятия решений на основе комплексного анализа данных заемщика. Она анализирует риск невозврата и определяет параметры кредита — условия, лимит, срок, обеспечение. Причем не имеет значения, идет ли речь о микрофинансировании, потребительском кредитовании, автокредитах, ипотеке.
Технология распознавания обнаруживает и извлекает из справки о доходах все данные табличной части, в том числе при размещении информации на двух страницах. Система обрабатывает до нескольких сотен атрибутов, содержащихся в справке о доходах.
Таким образом, автономная OCR для смартфона помогает банкам ускорить процесс коммуникации с клиентом и, что не менее важно, сократить число ошибок ввода, которые приводят к необоснованным отказам.
Технологии распознавания Smart Engines используются в банках не только для обработки документов, но и для считывания данных QR‑кодов, банковских карт и при сканировании номеров телефонов. Об этом мы подробно рассказали в нашем блоге.
Где OCR может использоваться еще?
Автоматизация бухгалтерской отчетности
Давайте представим себе компанию Х, занимающуюся продажей гидравлического оборудования. В ней работает бухгалтер, который контролирует участок товарно‑материальных ценностей (ТМЦ) и отвечает за оформление процессов закупки материалов, товаров и услуг. Ежедневно он обрабатывает по 60–70 первичных документов. На каждый из них у него уходит от 5 до 10 минут. То есть в день бухгалтер‑материалист тратит на эти процессы по 6–7 часов.
Теперь предположим, что сотрудник вводит данные из документов не вручную, а с помощью системы распознавания для десктопных, серверных и мобильных платформ. OCR извлекает атрибуты счета‑фактуры за 2–3 секунды, платежного требования — за 2 секунды. Иначе говоря, те же самые 60–70 документов решение обрабатывает за считаные минуты. При автоматическом вводе снижается и вероятность ошибки, исключается риск утечки.
Упрощение аудиторских проверок
Выездные аудиторы обычно работают в офисе клиента. Согласитесь, в условиях такой «полевой» работы каждая минута на счету. Вспомним, сколько стоит рабочее время таких выездных сотрудников. Такой режим задает высокую планку для допустимого времени извлечения данных из документа. А какова цена ошибки при вводе данных из важных бухгалтерских документов?
Точность считывания данных для аудитора особенно важна.
Автоматизация программ лояльности
Хотя в мире уже сформировался тренд на автоматизацию процессов в работе с программой лояльности, многие компании по‑прежнему предпочитают действовать по старинке: взамен заполненной от руки бумажной анкеты дают пластиковую карточку. При ручной обработке результатов анкетирования процент ошибок составляет около 30%, в то время как автоматический ввод данных обеспечивает гораздо более высокий уровень точности.
Smart Document Engine также обеспечивает защиту персональных данных пользователей программ лояльности. Это наиболее надежный вариант обработки персональных данных — в этом случае информация не покидает контур безопасности. Если оператор персональных данных привлекает к их обработке внешних исполнителей, то это создает риск утечки. Пример тому — “Спортмастер”.
31 декабря 2022 г. в одном из телеграмм-каналов был опубликован архив с данными клиентов «Спортмастера». В распоряжении злоумышленников оказались имена, даты рождения, номера телефонов и адреса электронных почт. Этот архив содержит всего 1,655 млн строк информации о пользователях.
“Спортмастер” объявил о начале расследования, которое должно выяснить причины инцидента. По предварительным данным, утечка произошла через одного из подрядчиков компании, который имел доступ к указанной информации. Название компании-подрядчика, попавшего под подозрение, “Спортмастер” не уточняет.
Но вернемся к нашему лонгриду. Где еще можно применять нашу безопасную OCR?
Обработка KYC-анкет
Система KYC – Know Your Customer или Знай своего клиента (ЗСК) – это процедура идентификации контрагентов, обязательная для банков, бирж, криптобирж и букмекерских контор. С ее помощью организации защищают себя от риска работы с мошенниками, а также от контактов с лицами, внесенными в списки экстремистов и террористов.
В соответствии с этим принципом компании задают своим клиентам вопросы об их финансовой деятельности и т.д. Но сбор данных – это лишь первый этап, после которого следует обработка полученной информации. Система распознавания документов не только в разы увеличивает качество проверки данных из KYC-анкет, но и снижает санкционные риски.
Помимо этого Smart Engines проверит подлинность удостоверяющих документов, найдет признаки редактирования файлов и установит факты компрометации изображений, которые предъявляются в ходе онбординга клиентов.
Обработка ПЦР-тестов
Сейчас в России уже не действуют жесткие ограничительные меры, связанные с распространением коронавируса COVID-19, и мир вернулся к нормальному режиму жизни. Но угроза новых вспышек заболевания по‑прежнему остается. Система распознавания документов Smart Document Engine позволяет упростить процедуру проведения ПЦР‑тестов.
О том, как увеличить эффективность этой процедуры, мы подробно рассказывали в нашем блоге.
Напомним, что первый этап автоматизации ПЦР‑тестирования — ввод персональных данных клиента и заключение договора на оказание медицинских услуг. Smart Engines предлагает продукт для автоматизации ввода персональных данных.
И второй этап — это контроль валидности проведенных тестов. Система Smart Document Engine поможет проверить результаты теста и в небольшом офисе на 100 человек, и в торговых центрах, и транспортных узлах, через которые проходят тысячи человек в день. Система считывает данные вне зависимости от формы результатах ПЦР‑теста. Единого шаблона таких справок пока нет.
Обработка логистической документации
В качестве примера представим себе логистический склад, где водитель‑экспедитор в соответствии с универсальным передаточным документом (УПД) или товарной накладной по форме ТОРГ-12 передает кладовщику под ответственное хранение весь товар. Какое оборудование, помимо шариковой ручки, в такие моменты под рукой? Максимум — терминал сбора данных или какой‑то смартфон. Автономная OCR Smart Document Engine для мобильного телефона значительно ускорит работу кладовщика.
На каком этапе развития компании пора внедрять OCR по распознаванию документов?
AI‑решение по распознаванию документов существенно повышает эффективность бизнеса и потому не может стоить дешево. В ряде случаев руководству компании в моменте удобнее держать в штате несколько человек, которые в течение дня вводят и обрабатывают документы (первичку, KYC анкеты, заявления и т. д.), чем нести затраты на покупку OCR.
Мы подсчитали, что если организация — вне зависимости от того, чем она занимается — обрабатывает в год более 100 тыс. документов или использует хотя бы двух операторов ручного ввода, то ей имеет смысл приобретать решение по распознаванию текста уже сейчас.
Спасибо, что дочитали до конца нашу статью!
Специально для вас мы собрали ее ключевые поинты:
- Обработка документов с помощью планшетного сканера — это прошлый век;
- Передача персональных данных на обработку третьим лицам, во внешние сервисы и на краудсорсинг грозит утечками, большими штрафами, дисквалификацией, уголовной ответственностью;
- Обработка паспортных данных и другой чувствительной информации о клиентах необходимо проводить внутри своей ИТ‑инфраструктуры — в контуре безопасности;
- В декабре вышла новая версия ПО по безопасному распознаванию корпоративных документов — Smart Document Engine. Это полностью российская разработка. OCR быстро и точно работает на смартфонах. А на сервере скорость распознавания достигает впечатляющих 15 страниц в секунду.
- ocr
- ocr-технологии
- распознавание
- распознавание документов
- оптимизация трудозатрат
- оптимизация рабочего времени
- искусственный интеллект
- Блог компании Smart Engines
- Обработка изображений
- Искусственный интеллект
- Подготовка технической документации
Источник: habr.com
Как в ВТБ Лизинг выбирали инструмент OCR-распознавания и какие цифровые кейсы он позволил реализовать
ВТБ Лизинг запускает новые цифровые проекты, связанные с переходом бизнеса в онлайн. Компания планирует создавать новые продукты, опираясь на современные технологии, такие как OCR, с использованием искусственного интеллекта. Процессу выбора OCR-движка с учетом широкого спектра предъявляемых к нему требований посвящена эта статья.
Несмотря на то, что продукты OCR давно существуют на рынке, выбор подходящего решения оказался непростой задачей в силу ряда особенностей процессов ВТБ Лизинг
Процесс лизинговой сделки имеет сложную структуру и включает, в том числе, работу с большим количеством разнообразных документов, имеющих юридическую значимость. В идеале ЭЛИЗА должна уметь работать со всем объемом документации в электронном виде, причем с минимальными задержками в обслуживании для пользователей. Это подразумевает особые требования к OCR-решению, которое должно обрабатывать документы в контексте лизинговых сделок — как бумажные, так и те, что изначально создаются в электронной форме.
В поиске наилучшего инструмента распознавания текстов
Несмотря на то, что продукты OCR давно существуют на рынке, выбор подходящего решения оказался непростой задачей в силу ряда особенностей процессов ВТБ Лизинг. Нужное компании решение должно было представлять собой web-приложение, использующее актуальные библиотеки разработки, а кроме того, отвечать списку технических требований. Так, пользовательский интерфейс (UI) должен соответствовать брендбуку компании. Например, обеспечивать возможность стилизации среды под дизайн, используемый ВТБ Лизинг (цветовые гаммы, логотипы, шрифты, элементы управления), для того чтобы его можно было интегрировать в интерфейсы CRM, личный кабинет клиента, мобильное приложение и другие системы-абоненты.
Требовалось также реализовать широкий спектр функционала ролевых моделей: от административного интерфейса управления пользователями и их ролями до ролевой модели доступа к функционалу, интерфейсу, настройке параметров системы распознавания и автосравнения, отдельным сущностям в рамках OCR. Подразумевалась возможность разграничения уровня доступа на просмотр/редактирование/подтверждение изменений.
Нужно было обеспечить заведение пользователей, их аутентификацию и авторизацию через Active Directory, LDAP, непосредственно в системе, а также реализовать интерфейс логирования действий пользователей и интеграционных процессов с отображением отчетов на дашбордах.
С точки зрения технической реализация предполагался вариант on-premise. Компания не рассматривала облачные продукты – решение OCR должно устанавливаться на вычислительных мощностях лизинговой компании.
Важнейший перечень требований относился к поддержке обработки структурированных и неструктурированных документов. Например, паспорт гражданина РФ или счет-фактура имеют четкую структуру, которую можно разметить для распознавания по пикселям расположения необходимого объема информации в той или иной области документа. Для их распознавания на рынке предлагается ряд уже готовых и проверенных временем решений. Однако многие документы, с которыми работает ВТБ Лизинг, имеют нечеткую структуру, меняющую содержимое документов в зависимости от различных условий.
Специальные требования по обработке неструктурированных текстов включали:
- Автоматическое выявление в документах бизнес-сущностей.
Для автоматизации процессов важно не только распознать текст документа, но и выявить в нем нужные атрибуты: реквизиты контрагента, стоимость и параметры автомобиля, данные о полномочиях подписантов и т.д., и затем передать эти данные в системы-абоненты. В среднем из разных документов извлекается от 5 до 15 атрибутов примерно для 40 размеченных типов документов.
- Сравнение документов.
Эту работу традиционно выполняет человек-верификатор – сравнивает документ, отправленный контрагенту на подпись, с подписанным вариантом. Это необходимо, поскольку на рынке, к сожалению, встречаются недобросовестные партнеры, которые пытаются незаметно внести изменения в текст договора на этапе подписания, фактически фальсифицируя согласованный документ. Обычно человек сравнивает документы, опираясь на перечень формальных требований, заданных в инструкции проверки, — это проверка конкретных пунктов документа с динамическими значениями. При этом верификаторы не проверяют текст, который является статичным и невариативным. Заменяющая работу человека информационная система должна уметь самостоятельно определить тип документа и перечень элементов текста конкретного типа, чувствительных к изменениям, например, увеличение количества страниц в документе, отрыв реквизитов сторон от предыдущего текста, добавление / удаление текста и т.п.
- Автоматическая верификация обязательных сведений.
Верификация документа – это рутинная работа, включающая, например, проверку наличия подписей сторон на каждой странице, наличия в нужных местах печати, штампа. Ее можно и нужно передавать автоматизированной системе.
При этом, продолжает главный архитектор ВТБ Лизинг, OCR-решение должно быть универсальным – уметь встраиваться в любую ИТ-систему, работающую с документами. Еще одно существенное требование — экономическая эффективность.
ИТ-продукт с искусственным интеллектом – это всегда недешевое удовольствие. А системы распознавания текстов обычно требуют еще и отдельного лицензирования OCR-движка.
По сути требовалось найти такое OCR-решение, которое сможет обеспечить все вышеописанные технические требования при минимальных операционных затратах, более низких или сопоставимых с ручной работой сотрудников. И такое решение было найдено: партнером ВТБ Лизинг по направлению микросервиса OCR стала компания–разработчик, предложившая не только высокий технологический уровень продукта, но и лояльную политику расчета стоимости пользования им.
Фактически разработчик приступил к созданию ИТ-решения, кастомизированного непосредственно под требования ВТБ Лизинг, поясняет Константин Есюнин. Причем лизинговая компания становится совладельцем исходного кода.
Особенности микросервиса OCR
Решение, которое внедряется в ВТБ Лизинг, является универсальным приложением. С точки зрения реализации оно представляет собой веб-сервис с собственным интерфейсом пользователя (UI), который может при необходимости начать работать с любой информационной системой компании. Вместе с CRM в первичный список таких систем входят, в частности, личный кабинет клиента на корпоративном сайте и мобильное приложение.
Важный элемент решения – проверка качества данных. Дело в том, что оптическое распознавание текста может производиться с некоторой погрешностью, например, та или иная буква может быть распознана с ошибкой и пропущена в финальном тексте. В таких случаях OCR-решение ВТБ Лизинг с помощью встроенного механизма искусственного интеллекта и доступных корпоративных справочников способно «додумать», какой символ был пропущен, и восстановить исходный текст.
Эта задача еще больше усложняется при обработке документов, использующих рукописный текст. Например, в паспортах некоторые сведения могут быть заполнены от руки. Очевидно, что 100% распознавания текстов всех документов добиться невозможно, но система радикально сокращает нагрузку человека-верификатора, так как на ручную проверку попадают только те документы, с которыми OCR-программа не смогла справиться самостоятельно.
Управление работой верификаторов напоминает работу сотрудников контакт-центра. Все задачи на распознавание и сравнение документов имеют определенный норматив времени обработки: от момента, когда OCR-система передала документ на верификацию человеку, до ввода в систему проверенных человеком данных. При этом OCR-система собирает сведения о процессах ручной верификации в единый отчет. Это, в частности, помогает увидеть, какие задачи оказываются сложными для автоматической обработки, с какими типами документов это связано и какие типы ошибок электронной системы чаще всего встречаются.
Бизнес-кейсы для внедрения OCR-решения
На первом этапе проекта реализуется ряд наиболее востребованных бизнес-кейсов использования микросервиса OCR:
Лидогенерация
Клиент может обратиться в компанию за лизингом автомобиля по различным каналам: мобильное приложение, личный кабинет, лендинг, сайт ВТБ Лизинг. В ближайшем будущем будет добавлен канал кросс-продаж через «ВТБ Онлайн». Когда человек нажмет на кнопку «Оформить заявку на автомобиль в лизинговой компании», необходимо произвести быстрый скоринг потенциального клиента, а также построить дальнейшее взаимодействие с ним таким образом, чтобы сделка совершалась в течение нескольких часов.
Для этого необходимо, чтобы, во-первых, он предоставлял в компанию как можно меньше документов. Во-вторых, те документы, которые клиенту все-таки придется предоставить, например, паспорт, должны обрабатываться OCR-системой на скорости, близкой к реальному времени.
Сегодня для быстрого скоринга используется 28 внешних источников данных: ФНС, ЕГРЮЛ, ЕГРИП, бюро кредитных историй, арбитражи.
Помимо сканирования паспорта, клиент должен собственноручно подписать соглашение об обработке персональных данных, ведь по закону для обращения в Бюро кредитных историй (БКИ) требуется согласие клиента в бумажной форме и с физической подписью.
На нынешнем этапе гибридных электронно-бумажных коммуникаций с клиентами процессы лидогенерации включают различные нетривиальные элементы, как использование простой электронной подписи (ПЭП) для юридически значимых документов, а также фотографии листа с личной подписью, которая прикладывается к соглашению о персональных данных (СОПД) для БКИ. Распознавание СОПД и соглашения для БКИ также реализовано в интерфейсе OCR.
Распознавание коммерческих предложений большого количества поставщиков
Из тысяч вариантов коммерческих предложений от поставщиков автотранспортных средств, с которыми клиенты обращаются в лизинговую компанию, система OCR автоматически извлекает более 20 бизнес-сущностей, существенных для заключения договора лизинга: марка, модель автомобиля, стоимость, дата предложения, наименование поставщика, размер скидки, мощность и объем двигателя, тип коробки передач и другие параметры. Все извлеченные из предложения атрибуты автоматически подставляются в интерфейс лизингового калькулятора для последующего расчета графика платежей. Пользователю уже нет необходимости вводить их вручную.
Сравнение любого подписанного документа с оригиналом
Один из важных этапов бизнес-процессов лизинговой сделки – получение от клиента подписанного документа, который поступает либо по электронной почте, либо в бумажном виде добавляется на обработку менеджером, либо в цифровом виде — через операторов электронного документооборота. В этот момент запускается задача верификации документа: система OCR сама находит исходный шаблон, оригинал документа и сравнивает его с тем, который поступил от клиента.
Проверка параметров доверенности
В доверенностях, связанных с лизинговыми сделками, могут быть существенные расхождения с другими документами. Например, сумма, указанная в доверенности, оказывается меньше стоимости договора. Или доверенность выдана на определенный срок, который уже завершился. OCR-система автоматически проверит существенные параметры доверенности и, если найдет ошибки, сформирует соответствующее оповещение о том, что доверенность просрочена или подписант не уполномочен подписывать договоры выше лимита.
Проверка соответствия рыночной цене
На момент заключения лизинговой сделки необходимо знать рыночную стоимость автомобиля, чтобы исключить ситуацию неправомерного завышения или занижения его цены партнерами по сделке. Традиционно для этой цели сотрудник вручную проводит целое рыночное исследование. Это время еще больше увеличивается, если речь идет об автомобиле премиум-класса, когда в расчете необходимо учесть множество дополнительных опций, оказывающих влияние на окончательную стоимость. OCR-система, используя модуль «Справочник транспортных средств», извлекает из коммерческого предложения необходимые сведения и передает их на обработку другому микросервису, который определяет рыночную стоимость автомобиля на основании распознанных атрибутов. В случае существенного расхождения предлагаемой цены со среднерыночной на экране сотрудника появляется соответствующее предупреждение.
Текущий этап создания универсального OCR-сервиса
Описанные выше возможности OCR-сервиса реализованы в виде программного продукта, который в данный момент проходит опытно-промышленную эксплуатацию.
Согласно планам развития, в нынешней фазе система будет распознавать около 40 видов документов.
За это время данные должны быть не только распознаны, но и перенесены в систему CRM: если клиент заходит в личный кабинет и выкладывает скан паспорта, то время отклика системы для продолжения коммуникации составляет менее 10 секунд.
Ожидается, что после того, как клиент подгрузит в систему снимок паспорта, он за минимальное время получит одобрение сделки и договор для подписания.
Очевидно, что идеальных показателей сразу после запуска системы достичь не удастся, поскольку механизм распознавания документов на основе искусственного интеллекта требует времени для обучения моделей. Это значит, что чем больше документов будет распознавать OCR, тем более точным будет становиться само распознавание. Заданный целевой уровень точности — 99,8%.
Источник: www.tadviser.ru