Краткое погружение в Data Governance для Agile специалистов участвующих в трансформации больших компаний.
5 min read
May 5, 2022
Отмечу, что мы смотрим с точки зрения управления трансформации всей компании, и данная проблематика может быть не очень существенна для каждой команды в отдельности.
Возможная проблематика:
- Облако меток в Jira не поддается никакой логике — Например метка DevOps в куче существует в вариантах (DevOps, DEVOPS, Dev-Ops, Dev_Ops, DevOps с пробелом, DevOps со *) и не понятно по какому принципу ее надо ставить на Элемент бэклога.
- Связи между элементами бэклога дублируют друг друга, как в части названий связей (Например — “Зависит от” и ”Dependent on”), могут быть дублированы с Epic Link и т. д.
- Названия проектов и пространств имеют разную логику и зачастую не понятно что скрывается под проектом Dev. Проекты невозможно как то быстро сгруппировать.
- Не понятна полнота ведения бэклога группой проектов и можно ли доверять оценкам в Story Point?
- Создано много типов элементов бэклога(Задача, Task, Задание),и они используются кардинально различающимся способом от команды к команде.
- Не понятно, на сколько можно доверять Метрикам потока (flow metrics) и Дашбордам построенным по данным из Jira.
Команд 100+ и масштабы проблематики толко растут.
Простой ответ — ввести новую роль / человека, который будет “следить за порядком” но только как чтобы нечего не испортить и не затормозить трансформацию.
Кстати, ситуация с Jira является хорошим маркером для SM / RTE / Agile коучей, консультантов по изменениям, что с подобными проблемами могут сталкиваются и пользователи продуктов и сервисов создаваемые компанией. И лучше подойти к решению системно через Data Governance.
Ключевые элементы Agile трансформации
Без данных трудно быть DDDM. Полное название этого подхода — Data Driven Decision Making (DDDM), то есть информационно обоснованные решения (или data driven decisions). Он стал альтернативой подходу HiPPO (Highest Paid Person’s Opinion) — принятию решений на основе мнения руководства. Проблема этого подхода в том, что руководитель или менеджер не могут быть объективными и компетентными во всех вопросах и знать все особенности и нюансы. И что не маловажно иметь достаточно времени для отслеживания всех изменений на Рынке, в широком смысле слова.
Что такое Data Governance
Фактическим мировым отраслевым стандартном в области управления данными является DAMA-MDBOK.
Существуют и другие модели зрелости работы с данными:
- Data Management Maturity (DMM), является частью CMMI
- DCAM: The Data Management Capability Assessment Model
Но альтернативы мало помогут решить нашу, вполне конкретную проблему с Jira, они создавались для другого.
Также существуют фреймворки и базы знаний концентрирующиеся на том как работать уже с собранными данными:
- IIBA — Guide to the Business Analysis Body of Knowledge (BABOK)
- An Agile Approach to Big Data in SAFe
- Lean Data Science (LeanDC)
Термины
Data Governance — концепция управления данными, является частью корпоративных политик управления. Существует несколько фреймворков управления данными
DAMA International — независимая от вендоров глобальная ассоциация технических и бизнес-профессионалов, управляемая Советом директоров. Основана в 1980г в США за 21 год до Agile Манифеста.
DAMA-DMBOK. Свод знаний по управлению данными — всеобъемлющий справочник созданный DAMA, расшифровывается как DAMA — Data Managment Body of Knowledge. Труд монументальный, больше 830с. Главы написаны разными авторами, этим книга похожа на PMBOK от PMI и SRE от Google.
DMBOK Издание 1 — 2009г.
CDMP — Certified Data Management Professionals, сертификационные экзамены DAMA.
CDO — Chief Data Officer, Директор по данным — это один из высших руководителей компании, отвечающий за использование и управление данными в организации.
Базовые принципы DAMA
- Данные должны приносить новые ценности и новые продукты для компании.
- Данные — Ценный актив, который требует управления.
- Управление данными — отдельная корпоративная функция возглавляемая CDO.
- Управление данными не является частью ИТ, и сильно тяготеет к Бизнесу.
Организационная схема DAMA — Роли и Комитеты
Рамочная структура DAMA-DMBOK — Колесо DAMA
Помимо областей знаний, DAMA-DMBOK включает следующие
- Этика обращения с данными
- Оценка зрелости управления данными
- Управление данными и управление организационными изменениями
Где легко приземлить Data Governance по DAMA-DMBOK, а где будет сложнее.
- Международные корпорации
- Финансовые институты (отсюда выросла DAMA)
- Государственные структуры
- Энергетический сектор (не в последнюю очередь за счет ассоциаций OSDU и PPDM)
- Agile компании
- Производства
Важно отметить что мы смотрим в рамках этой статьи только на Big Business. Средний и малый бизнес лучше рассматривать отдельно, в рамках другой статьи.
В РФ существует Национальная система управления данными (НСУД), в нормативных документах которой описаны требования по управлению государственными данными. Модель работы ускользающе отличима от Dama.
- https://nsud.info.gov.ru/
- https://digital.ac.gov.ru/materials/
Первый шаг к DG в Agile компании
В лоб DAMA-MDMBOK трудно применить к Agile компании и при Agile трансформации. DAMA требует создавать комитеты, регламенты и еще много того, что не вписывается в Agile картину мира.
Что может сделать SM RTE c Jira
Можно системно подойти к организации работы с данными — применяя DAMA-DMBOK как справочник практик. Его можно успешно использовать для разрешения разногласий, особенно на первом этапе.
Принять, что в случае с Jira можно начать с 3х практик/областей:
- Разработка бизнес-глоссария (Business Glossaries)
- Master data management (MDM), еще это называется Управление Нормативно-справочной информацией (НСИ)
- Управление Качеством данных (Data quality)
Установить роли:
- Распорядители данных (Data Stewards) осуществляют надзор (oversight) за отдельными областями (domain) данных предприятия в процессе выполнения всех связанных с этими областями бизнес-функций.
- Владелец данных (Data Owner) — это распорядитель бизнес-данных, который обладает подтвержденными полномочиями на утверждение решений, касающихся его области данных.
На время наиболее активной фазы трансформации владельцем Домена с Jira может быть Лидер по изменениям. Важно определить заранее условия передачи полномочий в Трайбы/ART’s, которые в итоге являются владельцами бизнес-процессов, рождающих данные.
Основная задача Владелец данных — прочертить границы ответственности для Распорядителей данных и ИТ службы.
Роль распорядителя данных может быть взята кем ни будь из Scrum Master’ов.
Распорядитель данных на своем уровне может создавать:
Бизнес-глоссарий — это не просто перечень терминов с определениями. Каждый термин должен быть связан с другими полезными метаданными: синонимами, метриками, данными о происхождении, бизнес-правилами, информацией о распорядителе данных, отвечающем за термин, и т. д.
НСИ (MDM) — это ведение контента мастер и референс данных, таких как справочник типов проблем, статусов и понятий, валют, стран, товаров, продуктовых направлений и т.п. в зависимости от организации. В рамках формализации справочников данные о них попадают в т.ч. и в бизнес-глоссарий как описание этих самых справочников.
Инструмент — Внутренние примитивы Jira + Confluence.
Управление Качеством данных (Data quality) — проверка данных введенных в Jira т.е. Бэклог всех команд на полноту, согласованность и актуальность.
Инструмент — Confluence + JQL запросы позволяющие выявлять ошибки.
Следующие шаги сильно будут зависеть от организации, но можно предположить несколько Кейсов:
- Развитие Распорядителя данных в PO продукта, подразумевающего монетизацию.
- Если вы собрали данные, и они не используются — нужно попробовать их продать.
Источник: msklv.medium.com
Показатель качества данных к которому относится бизнес правило по классификации dama dmbok v2
Глоссарий
DAMA DMBOK2
Работая над проектом по популяризации «DAMA DMBOK2: Cвода знаний по управлению данными» мы столкнулись с большим количеством узкоспециализированных терминов. И решили их собрать на одной странице, чтобы дать возможность всем, кому это будет интересно и полезно, изучить определения, которыми оперирует DAMA DMBOK2 в частности и отрасль работы с данными в целом.
Глоссарий пополняется после разбора каждой новой главы DAMA DMBOK2.
Общие термины и определения
Архитектура данных
Определяет план управления активами данных в соответствии со стратегией организации по установлению стратегических требований к данным и проектам, отвечающим этим требованиям
Хранилище данных
Это система, в которой структурированно хранятся все виды данных для использования в целях анализа и/или составления отчетов. Считается ключевым компонентом систем бизнес-аналитики
Центральное хранилище данных
Отдельное, централизованное хранилище, в котором хранятся все данные компании. Отдельное и централизованное — в смысле структуры. Вполне возможно, что центральное хранилище данных работает на нескольких физических системах и/или в разных местах. Для пользователей это единственный центральный источник данных
Инструменты бизнес-анализа
Инструменты бизнес-анализа предназначены для грамотного создания отчетов и интерактивных дашбордов всевозможных форм и размеров. Примеры функциональных возможностей инструментов бизнес-анализа: таблицы, графики, детализации, формирование срезов данных, показатели эффективности, составление отчетов в реальном времени
Модель данных
Модель данных описывает способ структурирования данных в информационной системе
Концептуальная модель данных описывает структуру отношений между концептуальными объектами данных — сущностями. Графическая запись концептуальной модели данных обычно выполняется в виде диаграммы сущностей и связей (ERD)
Логическая модель данных описывает структуру ссылок между объектами логических данных — таблицами. Концептуальная модель связана с логической моделью в том, что сущности преобразуются в таблицы (точнее, в определения таблиц ), а отношения преобразуются в ограничения по связи этих таблиц. Лог ическую модель данных можно графически записать в виде диаграммы структуры данных (DSD)
Физическая модель данных описывает способ хранения данных в отдельной базе данных. Связь между логической и физической моделью данных устанавливается путем преобразования объектов логических данных в инструкции по определению баз данных в соответствии с конкретным языком определения данных (DDL, Data Definition Language). После исполнения языка определения данных на физической базе данных, определения объектов базы данных хранятся в словаре данных
Метаданные
Метаданные — это важная часть хранилища данных. Метаданные описывают фактические данные, находящиеся в хранилище. Примеры метаданных: определения полей в таблицах, описания преобразований из источника в хранилище данных, информация об обновлении хранилища данных и т. д. Метаданные хранятся в так называемом репозитории метаданных или словаре данных
Словарь данных
Это база данных, в которой хранятся уточняющие данные о структурах данных и базах данных — метаданные. Словарь данных или репозиторий метаданных — это централизованное хранилище информации о данных: определения, список значений, отношения с другими данными, происхождение и использование, формат, формулы расчета
Хранение и операции над данными
Процессы разработки, реализации и поддержки хранимых данных для максимального увеличения их ценности. Операции обеспечивают поддержку на протяжении всего жизненного цикла данных от планирования до удаления данных (уничтожения)
Утилизация данных
Процесс утилизации данных, хранящихся на магнитных лентах, жестких дисках и других формах электронных носителей, так, что данные становятся полностью нечитаемыми и не могут быть доступны или использованы в несанкционированных целях
Этика обращения с данными
Комплекс мер по обеспечению соответствия практик получения, хранения, управления, интерпретации, анализа, применения и ликвидации данных общечеловеческим этическим принципам, включая ответственность перед обществом
Безопасность данных
Обеспечивает сохранение приватности и конфиденциальности данных, защиту данных и надлежащий к ним доступ
Интеграция данных
Включает процессы, связанные с перемещением и консолидацией данных внутри и между хранилищами данных, приложениями и организациями
Качество данных
То, чему соответствуют данные согласно установленным требованиям касательно, например, надежности, валидности, полноты, актуальности и степени, к которой относятся данные в соответствии с бизнес-правилами.
Гарантия качества (QA)
Это процесс, который гарантирует определенное качество данных или корректные результаты исходя из поставленных требований. Обеспечение качества определено в стандарте «Системы менеджмента качества»
Процессы и продукты ETL
Программное обеспечение класса ETL обеспечивает доступ к исходным файлам и правильную загрузку хранилища данных. Но ETL — это скорее процесс, по которому данные извлекаются из исходной системы (Extract, извлечение), проверяются и корректируются для соответствия нормам хранилища данных (Transform, преобразование), а затем загружаются в хранилище данных (Load, загрузка). Во время процесса преобразования чаще всего данные очищаются, приводятся к единому формату и проверяются на качество — чтобы затем загрузить их целевое хранилище данных в приемлемом виде
Бизнес-правила
Это преобразование деловой стратегии, законодательства или опыта в руководство к действиям. Это система регулирований, которые сотрудники и компании должны учитывать при осуществлении своей деятельности
Управление результативностью
Управление результативностью организации — это постоянный процесс, в котором достижение целей, или повышение эффективности деятельности, контролируется конечной целью реализации стратегии. Оно сосредоточено не только на финансовых целях, но и на внутренних процессах, на клиенте, на инновациях и на росте организации: на всех четырех аспектах сбалансированной системы показателей. Термин используется для описания методов, показателей, процессов и систем, используемых для контроля и управления эффективностью деятельности предприятия
Сбалансированная система показателей
Методология, разработанная Робертом Капланом и Девидом Нортоном в 1992 году, с целью получить четкое представление об эффективности организации. Сбалансированная система показателей работает с показателями, дающими оценку по предварительно определенным критериям. На основании этих оценок можно получить представление об эффективности работы организации. Критерии делятся на четыре равновесных аспекта: клиент, процесс, инновации и финансы
Ключевые факторы успеха
Ключевые факторы успеха показывают, что именно делает (или должно делать) организацию действительно уникальной, и описывают процессы, которые являются определяющими для успеха или провала организации. Ключевой фактор успеха — это характеристика организации или среды, существенной для жизнеспособности и успеха этой организации. Он может быть как положительным, так и отрицательным
Основная мысль заключается в том, что некоторые аспекты работы настолько важны, что им необходимо уделять больше внимания — на стратегическом уровне. Каплан и Нортон наоборот утверждают, что стратегия должна содержать ограниченное число ключевых факторов успеха, от 7 до 10. Иначе она быстро станет непонятной, а внимание — рассеянным среди слишком большого количества объектов. Кроме того, ключевые факторы успеха должны быть уравновешены, равномерно распределены среди разных направлений при управлении организацией
Директор по данным (Chief Data Officer)
Это должностное лицо компании, ответственное в масштабах предприятия за управление информацией и ее использование в качестве основного актива путем обработки, анализа, поиска данных, торговли информацией и другими способами
Возврат от инвестиций (ROI)
Это коэффициент, показывающий уровень доходности или убыточности бизнеса или внедряемой системы, учитывая сумму сделанных вложений. Может выражаться во времени (за какой период мои инвестиции окупятся) или в процентах (какой процент прибыли мне принесут мои инвестиции)
Совокупная стоимость владения (TCO)
Управление качеством информации (IQM)
Это процесс, с помощью которого измеряются и улучшаются интерпретируемое качество и значение информации, используемой для принятия решений, анализа деятельности и управления организации
Стюард информации
Стюард информации несет ответственность за внесение элементов данных в реестре метаданных. Эта функция встречается в организациях, в которых важен обмен и повторное использование данных между несколькими системами
Управление знаниями (KM)
Это процесс сбора, обработки и особенно обмен знаниями, умениями и опытом в компании с целью переработки и сохранения массива качественных экспертных знаний
Концептуальная модель данных (Conceptual Data Model, CDM)
Фиксирует высокоуровневые требования к данным как к набору взаимосвязанных понятий. Она содержит только базовые и критически важные для бизнеса сущности в рассматриваемой функциональной области с описанием каждой сущности и связей между ними
Логическая модель данных (Logical Data Model, LDM)
Детально отражает требования к данным, обычно в контексте их конкретного применения — например, с точки зрения потребностей в данных пользовательских приложений. На логическом уровне модель данных всё еще независима от каких-либо технологических ограничений, которые возникают и учитываются лишь на стадии реализации. Обычно логическая модель, по крайней мере поначалу, строится как детализирующее расширение концептуальной модели данных. В реляционных схемах логическая модель данных строится путем добавления атрибутов к объектам концептуальной модели
Физическая модель данных (Physical Data Model, PDM)
Отражает детализированное техническое решение, за основу которого обычно берется логическая модель данных, а затем доводится до состояния полной совместимости с комплексом аппаратного и программного обеспечения и сетевого оборудования. Физические модели данных разрабатываются в расчете на конкретные технологии. Реляционные базы данных, например, проектируются с учетом функциональной специфики СУБД, которую планируется использовать
Денормализация данных
Намеренное внесение в физические таблицы, создаваемые на основе нормализованной логической модели, избыточных или дублирующих друг друга полей данных (т.е. подразумевается умышленное размещение одного и того же атрибута в двух или более местах)
Нормализация данных
Заключается в применении наборов правил, позволяющих упорядочить всё разнообразие необходимых для ведения бизнеса данных в стабильные структуры (по сути — сделать так, чтобы каждый атрибут содержался строго в одном месте во избежание избыточности данных и, как следствие, их возможной противоречивости)
Прямое проектирование
Построение нового приложения, начиная с выяснения предъявляемых к нему требований. Cначала создается CMD, чтобы понять границы и состав предстоящих работ, выработать и согласовать ключевую терминологию. Затем создается LMD, документирующая бизнес-решение, и наконец — PMD, документирующая техническое решение.
- Выбор схемы
- Выбор нотации
- Создание исходной CMD
- Учет корпоративной терминологии
- Окончательное согласование
Логическое моделирование данных
Логические модели данных требуют модификаций и адаптации с целью получения итогового проектного решения, обеспечивающего эффективную работу в среде конкретной СУБД.
- Анализ информационных потребностей
- Анализ имеющейся документации
- Добавление ассоциативных сущностей
- Добавление атрибутов
- Определение доменов
- Определение ключей
Физическое моделирование данных
- Разрешение логических абстракций
- Добавление детальной информации об атрибутах
- Добавление объектов справочных данных
- Определение суррогатных ключей
- Повышение производительности за счет денормализации
- Повышение производительности за счет индексирования
- Повышение производительности за счет секционирования
- Создание представлений данных
Обратное проектирование – реверс-инжиниринг
Это процесс документирования существующей базы данных. Первым делом составляется PMD с целью понять техническое устройство имеющейся системы, затем создается LMD с целью документирования решаемых ею бизнес-задач, и, наконец, подготавливается CMD для документирования области применения системы и используемой терминологии
Источник: dataliteracy.ru
DAMA-DMBOK2: трудности перевода
В 2019 году на русском языке вышел первый перевод книги DMBOK2 ассоциации DAMA.
09.04.2020 Николай Скворцов
- Ключевые слова / keywords:
- data management
- Data Science
- Академия данных
- Data Academy
- НСУД
- National Data Management System
- Управление данными
Эффективность организации управления данными во многом определяет успех цифровой трансформации, невозможной без реинжиниринга корпоративных бизнес-процессов, и русское издание DAMA-DMBOK2 может стать здесь важным подспорьем.
Обсуждение цифровой трансформации невозможно без переосмысления понятия «данные», вопросы управления которыми рассматриваются сегодня уже на федеральном уровне. Так, в рамках программы «Цифровая экономика Российской Федерации» предусмотрено уже к 2021 году создание национальной системы управления данными (НСУД). В основе этой системы лежат три принципа: данные — стратегический актив, имеющий ценность; ценность может быть повышена за счет дополнительной обработки; как и любым другим активом, данными необходимо управлять. Между тем о важности проблемы управления данными серьезно задумались многие коммерческие и некоммерческие организации.
Поле деятельности в сфере управления данными достаточно обширно и включает буквально все — начиная от принятия решений о том, как извлечь стратегическую выгоду из имеющихся информационных активов, и кончая развертыванием и эксплуатацией цифровых платформ и их поддержкой. Управление данными требует весьма разнообразных как технических, так и бизнес-навыков, а ответственность за управление данными распределяется между бизнес-менеджерами и сотрудниками, обеспечивающими координацию бизнеса и ИТ (директор по данным, распорядитель данных, бизнес-аналитик и пр.). Ясно, что эффективное сотрудничество всех этих специалистов невозможно без общего языка общения.
В целом можно считать, что к профессионалам по управлению данными относится любой сотрудник любой организации, который по характеру своей работы имеет отношение к одному из аспектов управления данными. Для оказания помощи таким специалистам еще 30 лет назад была образована Международная ассоциация управления данными DAMA (Data Management Association International), объединяющая профессионалов в области управления данными по всему миру и призванная собирать, систематизировать и пропагандировать лучший опыт. Важная задача DAMA — выработка единой терминологии и рамочной структуры (framework) знаний и подходов.
В 2009 году вышло первое издание Руководства DAMA к своду знаний по управлению данными (DMBOK), заложившее фундамент развития и созревания совокупности профессий, относящихся к управлению данными, а в 2017 году увидело свет второе издание — DAMA-DMBOK2.
Основное назначение DMBOK — предоставление наиболее полного, точного и актуального введения в дисциплину управления данными:
- выработка общепринятого согласованного представления об областях знаний по управлению данными (11 областей);
- определение руководящих принципов управления данными;
- предоставление стандартных определений для наиболее часто используемых понятий (общих и по областям знаний);
- обзор лучших практик, методов и методик, а также альтернативных подходов;
- краткий обзор общих организационных и культурных вопросов;
- уточнение границ сферы управления данными.
Сегодня в России все больше предприятий определяют себя как «управляемые данными» (data-driven) — у отечественного бизнеса, нацеленного на сохранение своей конкурентоспособности, не остается иного выбора, кроме как перейти к применению аналитики в поисках действенных решений и отказаться от принятия решений, основанных лишь на интуитивных предположениях. Более того, нынешний темп изменений в бизнес-среде прямо указывает на то, что назревшие перемены в области управления данными носят уже характер обязательных, а не факультативных. «Цифровой прорыв» стал нормой, и для адекватной реакции на него бизнес должен плотно взаимодействовать со всеми специалистами по управлению данными для создания наиболее эффективных решений.
Управление на основе данных подразумевает безусловное признание необходимости управлять ими эффективно, причем речь идет не о создании отдельных частных решений по повышению качества данных или управлению нормативно-справочной информацией (НСИ), а о построении полнофункциональной системы управления данными. Требуется определить основные функции этой системы, выделить и устранить пробелы в их реализации. Подобного рода система должна опираться на хорошо проработанную рамочную структуру функциональных областей управления данными — именно такая структура («колесо» DAMA — DAMA Wheel) и предлагается в DMBOK2. Однако до недавнего времени в России отсутствовал русскоязычный вариант этого авторитетного справочника, написанного ведущими аналитиками во взаимодействии с участниками ассоциации DAMA.
Сегодня появился перевод книги DMBOK2 [1]. Однако на пути к всеобъемлющему и целостному изданию, охватывающему все области знаний по управлению данными, было множество препятствий — начиная от отсутствия устоявшейся русскоязычной терминологии и заканчивая необходимостью учета множества нюансов в каждой из областей знаний, имеющих отношение к управлению данными. Тем не менее была обеспечена достаточно высокая степень соответствия оригиналу благодаря применению при переводе DMBOK2 следующих трех принципов:
- Максимальный учет существующей практики перевода терминов. Каждый из применяемых в издании терминов переведен с учетом уже имеющихся прецедентов, причем для поиска вариантов перевода использовались наиболее авторитетные источники: публикации в известных журналах и сборниках, переводные материалы ведущих отечественных ИТ-компаний и отраслевых организаций, официальные переводы международных стандартов.
- Точность перевода. DMBOK — серьезное руководство, имеющее важное методическое значение, и практически в каждом его предложении отражены основные шаги какого-либо процесса, свойства объекта или принципы деятельности. Неточный перевод мог бы ввести читателя в заблуждение и привести к неправильному использованию изложенных практик.
- Cохранение стиля издания. В DMBOK обобщен опыт множества специалистов в области управления данными — издание содержит много поясняющих замечаний и конкретных практических рекомендаций. Например, различие и связь между руководством данными (Data Governance) и управлением данными (Data Management) лаконично разъясняется следующим образом: руководство данными нужно для того, чтобы «делать правильные вещи», а управление данными — для того, чтобы «делать вещи правильно». Не менее полезна практическая рекомендация по поводу уровня детализации стандартов данных: «Важно помнить, что документирование дает возможность зафиксировать детальную информацию или знания, которые без такой фиксации могут быть потеряны. Воссоздание или реверс-инжиниринг c целью получения доступа к этим знаниям весьма затратны по сравнению с документированием в самом начале их выявления». Все подобного рода фрагменты были сохранены в переводе максимально близко к оригиналу.
При переводе отраслевой терминологии был достигнут компромисс между стремлением использовать привычные и понятные русскоязычные термины и сохранением терминологической стройности, связности и лаконичности оригинального текста. В этой связи возникли проблемы в отношении двух ключевых терминов: Data Governance и Data Stewardship, для которых наиболее приемлемым решением стало введение семантических неологизмов (сочетаний терминов, которые звучат не совсем по-русски, но по смыслу наиболее точно соответствуют оригиналу): «руководство данными» и «распоряжение данными».
Наиболее весомыми аргументами в пользу этих вариантов стали пояснения, приведенные в тексте DMBOK2. Например, в отношении термина Data Governance приводится такой комментарий: «Слово “руководство” (governance) образовано от глагола “руководить” (govern), который в данном случае — ключевой. Смысл руководства данными проще всего понять на примере политического руководства.
В отношении данных предусматриваются функции, подобные законодательным (определение политик, стандартов и корпоративной архитектуры данных), судебным (управление проблемными вопросами и эскалация) и исполнительным (защита и обслуживание, выполнение обязанностей по администрированию). Для лучшего управления рисками большинство организаций выбирают представительную форму руководства данными, обеспечивающую учет мнений всех заинтересованных сторон». Поэтому слово «руководство» наиболее точно передает смысл, заложенный в оригинале. При этом следует заметить, что более корректным является следующий вариант перевода: «руководство в области управления данными». Однако, с учетом высокой частоты его использования и наличия многих производных от него терминов, такой вариант был бы крайне неудобен.
Подробные пояснения приведены и относительно термина Data Stewardship: «Деятельность, связанная с несением ответственности и подотчетностью за данные и процессы, обеспечивающие эффективный контроль и использование информационных активов, чаще всего обозначается термином “распоряжение данными” (data stewardship). Распорядитель (steward) — это лицо, чья работа заключается в управлении собственностью другого лица. Распорядители данных управляют информационными активами от имени других лиц и в интересах организации. Часто по отношению к тем, кто выполняет функции, подобные распорядительским, применяют такие термины-синонимы, как “хранитель” (custodian) или “попечитель” (trustee)».
DAMA-DMBOK2 — терминология
Важная задача ассоциации DAMA — выработка единой терминологии в области управления данными:
- управление данными (data management) — разработка, выполнение и контроль исполнения политик, программ и практик предоставления, проверки, защиты и повышения ценности данных и информационных активов на протяжении всего их жизненного цикла;
- руководство данными (data governance) — деятельность по осуществлению руководящих и контрольных полномочий (планирование, мониторинг и обеспечение выполнения) в отношении управления информационными активами (см. рисунок);
- распоряжение данными (data stewardship) — деятельность, связанная с несением ответственности (и подотчетностиью) за данные и процессы, обеспечивающие эффективный контроль и использование информационных активов;
- распорядитель данных (data steward) — лицо, управляющее информационными активами от имени других лиц и в интересах организации;
- владелец данных (data owner) — распорядитель бизнес-данных, обладающий подтвержденными полномочиями на утверждение решений, касающихся его области данных;
- жизненный цикл данных (data lifecycle) — совокупность процессов (процессы, создающие или получающие данные; процессы, которые осуществляют их перемещение, преобразование, хранение, а также обеспечивают обслуживание данных и предоставление совместного доступа к ним; процессы использования или применения данных, а также процессы, обеспечивающие их ликвидацию);
- происхождение данных (data lineage) — путь, по которому данные движутся от места своего возникновения до места использования (иногда называемый цепочкой данных, data chain).
Разделение ответственности между руководством и управлением данными |
От эффективности организации управления данными во многом зависит успех цифровой трансформации, поэтому неудивительно, что сегодня уже на федеральном уровне активно обсуждаются такие вопросы, как обязанности и полномочия руководителей цифровой трансформации органов федеральной власти по реинжинирингу рабочих процессов внутри министерств и ведомств для поддержки инфраструктур оказания онлайн-услуг населению. Русское издание DAMA-DMBOK2 может быть важным подспорьем в решении этих ответственных задач. Выпуск книги стал важным шагом на пути к созданию терминологии для общения отечественных специалистов, работающих с данными, и к продвижению современных методических подходов к управлению данными в российских государственных и коммерческих структурах.
Варианты перевода многих терминов из книги DAMA-DMBOK2 могут вызывать вопросы, однако пока вышла лишь первая редакция русского издания, подготовленная компанией Unidata. Работа над следующими редакциями будет продолжена, в том числе и при активном участии сообщества Unidata Community.
Литература
1. Дмитрий Волков. Руководство по управлению данными // Открытые системы.СУБД.— 2019.— № 4. — С. 47. URL: www.osp.ru/os/2019/04/13055217 (дата обращения: 21.04.2020).
Источник: www.osp.ru