В этой статье описывается концепция отраслевых онтологий и способы их использования в контексте Azure Digital Twins.
Словарь решения Azure Digital Twins определяется с помощью моделей, которые описывают типы объектов, существующих в вашей среде. Онтология — это набор моделей, которые полностью описывают данную область, такие как производство, строительные структуры, системы Интернета вещей, интеллектуальные города, энергетические сети, веб-содержимое и многое другое.
При создании набора моделей с нуля, который является полным и описывает домен, вы создаете собственную онтологию. Кроме того, иногда стандарты моделирования для отрасли уже существуют, и может быть эффективнее опираться на существующую онтологию вместо того, чтобы создавать онтологию с нуля самостоятельно.
В статьях в этом разделе объясняется больше о создании онтологий и использовании уже существующих отраслевых онтологий для сценариев Azure Digital Twins, в том числе о существующих онтологиях, доступных сегодня, и о различных стратегиях по преобразованию отраслевых стандартов в онтологии для использования в Azure Digital Twins.
3.1 Онтология в структуре философского знания — Философия для бакалавров
Сводка стратегий онтологии для Azure Digital Twins
Ниже приведены main стратегии создания онтологий DTDL для использования в Azure Digital Twins. Выберите тот, который подходит вам лучше всего, в зависимости от того, насколько хорошо существующие материалы для вашей отрасли уже соответствуют вашему решению.
Использование существующих онтологий
Существующие отраслевые онтологии обеспечивают отличную отправную точку для решений цифровых двойников. Они включают набор моделей для конкретных доменов и взаимосвязей между объектами для проектирования, создания и анализа цифрового двойника графа. Отраслевые онтологии позволяют разработчикам решений начать работу с цифровыми двойниками с проверенной отправной точки и сосредоточиться на решении бизнес-задач.
Использование этих онтологий в ваших решениях также позволяет настроить их для более эффективной интеграции между разными партнерами и поставщиками, так как онтологии могут обеспечить общий словарь в разных решениях.
Ниже приведены некоторые другие преимущества использования стандартных отраслевых онтологий DTDL в качестве схем для графов двойников.
- Согласование программных компонентов, документации, библиотек запросов и т. д.
- Сокращение инвестиций в концептуальное моделирование и разработку систем.
- Упрощение взаимодействия с данными на семантическом уровне.
- Рекомендуется использовать повторно, а не начинать с нуля
Корпорация Майкрософт создала несколько онтологий DTDL с открытым кодом, основанных на широко используемых отраслевых стандартах. Вы можете внедрить эти онтологии в стандартные решения или расширить онтологии с помощью собственных дополнений для настройки решений. Поскольку модели в Azure Digital Twins представлены на языке определения Цифровых двойников (DTDL), онтологии, предназначенные для Azure Digital Twins, написаны на языке DTDL.
ОНТОЛОГИЯ. Основы философии.
Если у вас есть набор моделей для вашей отрасли, представленных в другом стандартном отраслевом формате, например RDF или OWL, вы можете использовать его в качестве отправной точки и преобразовать модели в DTDL , чтобы использовать их в Azure Digital Twins.
Создание собственных онтологий
Если нет отраслевой онтологии, которая соответствует вашим потребностям, вы всегда можете разработать собственные пользовательские онтологии DTDL с нуля. Они могут быть вдохновлены применимыми отраслевыми стандартами или любой другой информацией, имеющей отношение к вашему бизнесу.
Сведения о проектировании отдельных моделей, включая все содержащиеся в них поля и способах их создания в DTDL, см. в разделе Модели DTDL.
Полный путь разработки модели
Независимо от того, какую стратегию вы выберете для разработки или интеграции онтологии в Azure Digital Twins, вы можете выполнить полный путь ниже, чтобы получить инструкции по созданию и отправке онтологии в качестве моделей DTDL.
- Начните с изучения моделирования DTDL в Azure Digital Twins.
- Продолжайте использовать выбранную стратегию онтологии: внедряйте, преобразуйте, расширяйте или создавайте модели в зависимости от потребностей вашего решения и отрасли.
- Проверьте свои модели, чтобы убедиться, что они работают с документами DTDL.
- Отправьте готовые модели в Azure Digital Twins с помощью API или примера, подобного отправке модели Azure Digital Twins.
После отправки моделей в службу вы можете.
- Визуализация моделей в онтологии с помощью графа моделей в Azure Digital Twins Обозреватель.
- Управляйте ими на постоянной основе, включая получение моделей в коде, обновление моделей и удаление моделей с помощью инструкций в разделе Управление моделями DTDL.
- Используйте модели для создания цифровых двойников и графа двойников.
Дальнейшие действия
Узнайте больше о стратегиях внедрения, расширения и преобразования существующих онтологий:
- Внедрение отраслевых онтологий на базе DTDL
- Расширение онтологий
- Преобразование онтологий
Сведения об использовании моделей для создания цифровых двойников: Цифровые двойники и графы двойников.
Источник: learn.microsoft.com
37. Применение онтологий. Значение онтологий для бизнеса.
Онтологии могут быть использованы при решении следующих задач:
- для совместного применения людьми или программными агентами
- для возможности накопления и повторного использования знаний в предметной области
- для создания моделей и программ, оперирующих онтологиями.
- для «извлечения значимой информации из web-страниц при индексировании». В некоторой степени данная технология частично закрывает потребность в семантическом поиске.
Часто онтологии используют в качестве:
- «Словаря предметной области». Онтология содержит общую терминологическую базу предметной области, поэтому разработчики программного обеспечения могут использовать термины из онтологии для документирования своего продукта и для формирования пользовательского интерфейса, в том числе и многоязычного.
- «Отображения на базу данных». Онтология предоставляет набор базовых терминов предметной области, с которыми приходится иметь дело в любом процессе измерения. Поэтому онтология является удобным базисом для разработки схемы данных измерительной системы. Она не является полной, поскольку любой конкретный процесс измерения имеет частные особенности, не задаваемые на уровне онтологии. Тем не менее, она определяет базовые понятия, которые в той или иной форме присутствуют или должны присутствовать в любой схеме данных.
- «Формата хранения метаданных». Свойства онтологических терминов определяют состав и формат представления метаданных, содержащихся в системе. Эффективная поддержка метаданных является одной из ключевых задач инженерии информационных систем. Привлечение онтологии позволяет повысить эффективность реализации различных средств обработки данных благодаря формированию богатых массивов метаинформации в машинно-читаемой форме.
- «Формата обмена данными». Открытые форматы обмена данными с внешними системами, основанные на онтологии, существенно упрощают задачу интеграции систем, относящихся к различным областям либо созданных различными разработчиками.
Значение онтологий для бизнеса:
IT-системы организуют значения с помощью реляционных моделей данных, линейных файлов, объектно-ориентированных моделей или специально разработанных моделей данных. Время от времени, в связи с изменениями бизнес-требований, возникает необходимость добавления новых элементов и связей в реляционные модели данных или объектно-ориентированные модели.
Более того, если организация использует множественные приложения от различных поставщиков, то придется копировать одни и те же модели во все базы данных приложений. Например, банк предлагает набор различных продуктов для обслуживания разнообразных категорий клиентов. Корпоративному клиенту может потребоваться услуга по обнаружению мошенничества, а обычному потребителю окажется достаточно функциональных возможностей интерактивного осуществления банковских операций с помощью интернета. Обычно банк приобретает приложения у нескольких поставщиков, но каждое из них повторяет одну и ту же общую информацию — номера счетов, имена клиентов и т. д. — в своей базе данных. По мере того как организация добавляет новые продукты для удовлетворения растущих запросов бизнеса, одна и та же избыточная информация распространяется по всей корпорации.
Целый ряд услуг является общим для всех приложений, например, просмотр банковских транзакций и электронных переводов. Каждая из этих услуг также дублируется в формате, присущем тому или иному приложению, что ведет к необходимости осуществления точечной интеграции.
Если же банк принимает подход, основанный на онтологии, то он может собирать и представлять общую информацию о продуктах в нейтральной по отношению к языку форме и сохранять эту информацию в центральном репозитории. С помощью такой общей адаптированной онтологии организация может обеспечивать единое стандартизированное представление данных для всех приложений. Такое стандартизированное представление позволяет точно извлекать необходимую информацию и без проблем осуществлять корпоративную интеграцию, поскольку бизнес-процессы и различные источники данных могут быть связаны («отображены») друг с другом с помощью общей мета-модели. Таким образом, общая онтология исключает необходимость в точечной интеграции и упрощает интеграцию приложений, сокращая избыточность данных и обеспечивая одно и то же семантическое значение для всех приложений, что облегчает поддержание функционирования банка и его обновление.
Источник: studfile.net
Ключ к гиперавтоматизации: онтологические модели
Всепроникающая цифровизация, о которой сегодня много говорят применительно к корпоративному сектору, требует новых подходов и архитектур поддержки работы с информацией, среди которых — онтологические модели и графовые базы данных.
24.09.2021 Елена Гайдукова
- Ключевые слова / keywords:
- OWL
- Semantic Web
- Semantic Web
- Архитектуры цифровизации
- Digitalization architectures
- Гиперавтоматизация
- Hyperautomation
- Граф знаний
- Knowledge Graph
- семантические технологии
Все, что можно автоматизировать, должно быть автоматизировано с одновременной оптимизацией бизнес-процессов. Однако нишевая автоматизация не может стать основой интеграции, необходима гиперавтоматизация, получившая реальное подкрепление в виде онтологического подхода к описанию предметной области и графовых баз, как адекватный инструмент реализации масштабных проектов.
Современные корпоративные ИТ представляют собой множество методов и инструментов обработки одних и тех же корпоративных данных. Различные модные технологии и методологии направлены на улучшение существующего состояния дел путем автоматизации определенных операций.
Например, для решения меняющихся бизнес-задач активно развиваются модульные подходы к автоматической компоновке и перекомпоновке прикладных систем (Kubernetes — автоматизация развертывания, масштабирования и управления контейнеризованными приложениями), а специалисты в области машинного обучения стремятся внести элементы автоматизации в выполнение рутинных операций в зависимости от условий решаемых задач. Однако нишевая автоматизация не может стать основой интеграции, и именно такая разрозненность стала сегодня основной стратегической проблемой корпоративных ИТ. Аналитики Gartner назвали гиперавтоматизацию одной из ключевых современных технологических тенденций: все, что можно автоматизировать, должно быть автоматизировано с одновременной оптимизацией бизнес-процессов. Иными словами, аналитики объявили бой унаследованным, неоптимальным для поддержки меняющихся бизнес-процессов системам, не указав, правда, как его выиграть.
Дата-центрическая архитектура
Корпоративные данные имеют ряд свойств, которые необходимо учитывать при создании ИТ-архитектуры цифрового предприятия.
Комплексная информатизация и цифровые бизнес-процессы коренным образом меняют парадигму обработки корпоративных данных. Если раньше было достаточно экономично хранить данные и обеспечивать доступ к ним, то сегодня ключевым становится повторное использование уже имеющихся данных, причем в разных контекстах.
Компании собирают все более крупные и детализированные массивы сведений о своих операциях, клиентах, участниках внутренних и внешних бизнес-процессов, объектах бизнес-операций и их характеристиках, в том числе с учетом всей истории. Однако об эффективности использования этих данных говорить не приходится, хотя и имеются попытки работать с обезличенными данными, накопленными сторонними организациями и компаниями, что предполагает экспоненциальный рост количества внутренних интеграций между различными прикладными системами. Отсюда вытекает другое ключевое свойство современных корпоративных данных — связанность. Связи между данными порождают, в частности, аналитические умозаключения и новые расчетные характеристики, обогащающие исходные данные и фактически превращающие корпоративные данные в корпоративные знания.
Переиспользование и связанность меняют представления о необходимой ИТ-архитектуре: важными становятся не сами данные, а их модель.
Наилучшим образом требованиям гиперавтоматизации отвечает дата-центрическая архитектура [1] поддержки логической связанности всех данных и обеспечения работы с ними разнообразных приложений, включая прогнозную аналитику и ПО машинного обучения.
Для создания единого описания данных, обеспечивающего поддержку их связанности и повторного использования, отлично подходят семантические модели [2], фактически добавляющие в структуру корпоративной информационной системы новый уровень — виртуальные сущности (образы сущностей реального мира: деталь, прибор, сотрудник и т. д.) и связи между ними.
Онтологические модели — наиболее развитый сегодня вариант семантического описания предметной области, формализующий знания о ней. В общем случае они включают словарь терминов предметной области и множество их логических взаимосвязей. В этом качестве онтологии претендуют на роль универсальной модели представления знаний для различных предметных областей. Критически важно, что онтологические модели пригодны для машинной обработки и поэтому обеспечивают возможность автоматической работы со знаниями (логический вывод) с целью получения нового знания в стиле, подобном логическим рассуждениям человека-эксперта.
Яркий представитель семантической парадигмы компьютерных ресурсов — Semantic Web, который базируется на онтологических ресурсах и специально разработанном для них консорциумом W3C языке онтологий Web Ontology Language (OWL), ставшем стандартом для многих технологических направлений (информационный поиск в больших массивах неструктурированных данных, обработка текстов на естественном языке и пр.), где используются специальные лингвистические онтологии. Онтологические модели также применяются в корпоративных информационных системах, в которых остро стоит проблема интеграции данных из разнородных источников.
Средством интеграции данных в виде логически организованной структуры для облегченного доступа и обмена в распределенной среде является матрица данных (data fabric) — с ней бизнес-пользователи встречаются при работе с «графом знаний» (knowledge graph) [3], визуализирующим объекты и отношения, описывающие знания той или иной онтологической модели. По сути, в корпоративной информационной системе появляется новый уровень абстракции — семантический, что открывает следующие возможности:
- гибкость описаний данных и их комплексов;
- единое описание данных и процессов;
- оперативное внесение изменений (информационные системы меняются в реальном времени вслед за изменениями в бизнес-процессах);
- обогащение семантического описания по мере развития бизнес-процессов и решения задач.
В целом онтологии выполняют функцию интеграции, обеспечивая общий семантический базис в процессах принятия решений и интеллектуального анализа данных, а также единую платформу для объединения разнообразных информационных систем. При этом появляется возможность естественным образом решать ряд актуальных для ИТ-подразделения задач.
Обеспечение системного подхода к накоплению данных. Не секрет, что сегодня огромные усилия ИТ-департаментов тратятся на очистку сырых данных, их проверку и валидацию. Мышление в терминах моделей принципиально меняет ситуацию: появляется унификация при описании различных данных с учетом их семантики.
Создание отраслевых и типовых корпоративных моделей данных. Такие модели модифицируют при появлении новых бизнес-задач путем добавления необходимых атрибутов, сущностей и связей.
Реализация простых и удобных механизмов работы с данными, доступных из единой витрины, формируемой из распределенного децентрализованного хранилища для поддержки разнообразной аналитической обработки и обогащения данных новыми аналитическими признаками. Это открывает возможности для создания прогнозных моделей любой сложности в интуитивно понятной форме, доступной бизнес-пользователям.
Обеспечение естественной среды консолидации и обмена опытом сотрудников. Эта задача приобретает особую значимость по мере роста мобильности бизнеса.
Рис. 1. Элементы семантической структуры дата-центрического корпоративного хранилища
Источник: Comindware
Иными словами, онтологические модели становятся посредниками между бизнес-пользователями и информационной системой. В частности, функции описания и управления бизнес-логикой могут перейти к бизнес-сотрудникам, а это не что иное, как один из вариантов реализации подхода Low-code к передаче функции автоматизации бизнес-процессов от ИТ-специалистов к бизнес-пользователям. Онтологии позволяют устранить искусственное разделение функционала бизнес-аналитиков и ИТ: первые могут теперь сами управлять структурой данных, внося изменения в онтологию, которая описывает и структуру данных, и логику их обработки.
Так на основе онтологических моделей создается семантическая структура единого дата-центрического корпоративного хранилища, ориентированного на совместное использование единого пространства данных. На базе этого хранилища могут быть сформированы цифровые образы сущностей реального мира (цифровые клиенты, цифровые продукты и сервисы, цифровые «вещи», цифровые бизнес-процессы) и объединены в цифровые комплексы и экосистемы (рис. 1).
Роль бизнес-процессов
Цифровые бизнес-процессы в семантической архитектуре играют роль связующего звена отдельных «вещей» и прочих объектов (сущностей), участвующих в цифровой бизнес-деятельности предприятий. Эта роль становится еще более важной по мере роста детализации информационных объектов — например, при создании цифрового двойника предприятия.
Рис. 2. Эволюция BPMS
Источник: Comindware
Современная цифровая платформа управления бизнес-процессами включает, в частности, управление регламентами бизнес-процессов, поручениями и кейсами (Adaptive Case Management, ACM), документооборотом, задачами и ресурсами и обеспечивает интеграцию с механизмами Интернета вещей и RPA, а также быстрое создание и изменение цифровых решений для любых предметных областей, в том числе за счет механизмов Low-code. В результате ядром гиперавтоматизации становится BPMS (рис. 2).
Семантические подходы становятся ключом к реализации концепции гиперавтоматизации, интегрируя в единое целое различные технологии на базе единого семантического поля (онтологические модели и графовые базы).
Практическая реализация
Рис. 3. ИТ-архитектура на основе графовой базы с децентрализованной логикой back-end
Источник: https://hackernoon.com
Для реализации онтологической модели используются графовые базы данных, такие как HyperGraphDB — модель мультиграфа, ArangoDB и OrientDB — мультимодельные СУБД, GraphX — распределенный фреймворк для работы с графами в экосистеме Hadoop, использующий вычислительный механизм Spark. Все графовые базы обеспечивают поддержку децентрализованной структуры данных и распределенных структур (рис. 3).
Если логика работы бизнес-приложений децентрализована, то NP-полные (позволяющие решить любую вычислительную задачу) смарт-контракты, такие как Ethereum, EOS или Cardano, могут ее поддерживать на нативном языке. Кроме того, в таких базах реализованы связанность данных через семантический слой ИТ-архитектуры и хранение как структурированной, так и неструктурированной информации. Все эти свойства — ключевые для онтологических моделей.
Поскольку главная особенность графовой базы данных — описание связей (отношений) между объектами предметной области, в ней могут размещаться данные любых типов, а также любые базовые интеллектуальные комплексы онтологий. По этой причине графовые базы достаточно гибкие и позволяют автоматически осуществлять логический вывод — решать на основе данных онтологического хранилища такие интеллектуальные задачи, как управление цепочкой розничных поставок или поддержка принятия решений при обслуживании цифровых месторождений.
Идея гиперавтоматизации, связанная с тотальной цифровизацией объектов и процессов в корпоративных информационных системах, получила реальное подкрепление в виде онтологического подхода к описанию предметной области и графовых баз как адекватного инструмента реализации масштабных проектов. Как подход, так и инструменты станут набирать популярность по мере того, как бизнес будет двигаться к гиперавтоматизации. Графовые базы применяются в Facebook — для управления социальной сетью, а в Amazon — для работы рекомендательного сервиса. В «Сбере» экспериментируют с прототипом бизнес-решения на основе сверхбольших графов, рассчитывая с их помощью решать в интерактивном режиме задачи с миллиардами связей: от поиска аффилированных лиц и организаций, до продуктовых рекомендаций. На основе графовой базы и онтологической модели данных работает российская BPMS-система Comindware Business Application Platform категории Low-code, которая позволяет бизнес-аналитикам создавать без посредников отраслевые решения на базе семантического содержания и менять их бизнес-логику с минимальным привлечением ИТ-специалистов.
Литература
1. Сергей Горшков. Три шага к дата-центричной архитектуре // Открытые системы.СУБД. — 2019. — № 4. — С. 26–29. URL: https://www.osp.ru/os/2019/04/13055224 (дата обращения: 21.09.2021).
2. Bastian Eine, Matthias Jurisch, Werner Quint. Ontology-Based Big Data Management // URL: https://www.mdpi.com/2079-8954/5/3/45/pdf, doi:10.3390/systems5030045 (дата обращения: 21.09.2021).
3. Евгений Хлызов. Управление данными на основе графов знаний // Открытые системы.СУБД. — 2018. — № 3. — С. 28–29. URL: https://www.osp.ru/os/2018/03/13054405 (дата обращения: 21.09.2021).
Гиперавтоматизация,семантические технологии,Semantic Web,OWL,Граф знаний,Hyperautomation, semantic technologies, Semantic Web, Knowledge graph
Источник: www.osp.ru