BI-система — набор инструментов и программ для бизнеса, которые собирают данные из разных источников, анализируют их и представляют в наглядном виде.
Программа собирает и анализирует большие массивы данных, а затем показывает на одном экране в виде наглядных таблиц, графиков и схем. По аналитическим выкладкам видны проблемы и тенденции в бизнесе. BI-система сама собирает информацию из множества источников, поэтому сразу подсвечивает проблемы. Такие находки становятся основой для бизнес-решений.
Например, чтобы выяснить, какой рекламный канал приносит больше заказов по конкретной позиции, надо просмотреть несколько отчётов. Сначала изучить метрики и посмотреть, откуда идут заказы. Потом проверить, в каких заказах присутствует искомая позиция. Наконец, сверить эти два отчёта.
BI-система покажет отчёты на одном рабочем столе, сразу же найдёт нужные пересечения и покажет вывод. Ничего не придется делать руками.
BI-система от Microsoft — Power BI. Наборы данных можно представить в виде диаграммы, графика, карты
Для чего нужны BI-системы
Для сбора, хранения, анализа и наглядной демонстрации данных. При большом объеме данных для системы может потребоваться сетевое оборудование и регулярная техническая поддержка.
К BI-системе можно подключить много пользователей. Каждому человеку собрать дашборд — главное окно программы, на котором показаны графики, таблицы и диаграммы с аналитической информацией о бизнесе. Также можно настроить тип информации к которой у пользователя будет доступ. Например, маркетолог увидит данные о рекламе и динамике продаж, а логист — об остатках товара на складах в разных регионах. Если пользователю понадобится дополнительная аналитика, то он сможет самостоятельно сформировать отчет в системе.
Обычно данные хранятся так, как их удобно хранить, а не потреблять . Например, в таблице на десяток столбцов. Хранить удобно, а пользоваться – нет. BI-система собирает информацию сама и показывает её наглядно, что дает преимущества.
Выявляет системные проблемы бизнеса, помогает находить тенденции и точки роста. На основе собранных данных компания принимает обоснованные бизнес-решения.
Например, за пару кликов система покажет, что реклама в Telegram показывает бОльшую эффективность по сравнению с «Дзеном» и YouTube. Значит, неудачные рекламные кампании надо изменить или прекратить.
Предоставляет данные максимальному числу пользователей. Количество аккаунтов ограничивается финансовыми возможностями и условиями договора при покупке BI-системы.
К BI-системе можно подключить как базы данных внутри компании, так и внешние источники. Например, метрики со статистикой сайта или базы данных партнеров.
Допустим, для цветочного магазина.
Внутренние источники: база данных о количестве цветов на торговых точках и остатках на складах.
Внешний источник: подключаемые базы с наличием и ценами у поставщиков.
Экономит время получателей информации. Неспециалист может самостоятельно сделать запрос и сразу получить ответ. Он не ждет, когда аналитик сформирует и пришлет отчет.
Например, автор пишет статью в блог компании-застройщика. Ему не хватает цифр: статистики по строительству и продажам. Он задал запрос в BI-системе и сразу получил графики с цифрами. Без системы ему пришлось бы писать запросы в два департамента и ждать, когда у специалистов появится время, чтобы прислать данные.
Экономит время и силы аналитиков. BI-система находит и формирует ответы на большинство запросов пользователей. Аналитикам не нужно отвлекаться на посторонние задачи.
Из примера выше — освобождение бухгалтера и инженера от необходимости отвечать на запрос автора о статистике.
Упрощает и ускоряет процесс получения и изучения информации. Данные поступают к пользователю в наглядном и понятном виде. Не нужно тратить время на анализ информации из нескольких таблиц.
Две таблицы: первая с премиями для менеджеров по дням, вторая с успешными продажами по тем же дням
Те же две таблицы, загруженные в BI «Яндекса» — Yandex Datalens. Теперь видно, что некоторым менеджерам переплатили, а кого-то обидели
Кому нужна BI-система
BI-системы подходят крупным и средним по размеру организациям, где нужно анализировать большой объем данных из разных источников. Мелким предпринимателям не выгодно пользоваться таким дорогим и массивным инструментом, поскольку 2-3 источника данных можно проанализировать вручную.
Системы подходят для анализа любой информации, которую можно представить в виде базы данных и для которой требуется аналитика. Это удобный инструмент для анализа маркетинговой информации и он подойдёт, например:
- Агентствам или маркетинговым отделам. Поможет сегментировать клиентскую базу, понять какие каналы работают эффективнее, провести анализ рынка.
- Предпринимателям. Поможет отследить тенденции в развитии бизнеса и повлиять на них, в том числе в сфере продвижения товара или услуги.
Какие бывают BI-системы
В зависимости от физического нахождения данных
Облачные (SaaS) для клиентов, которые не боятся размещать свою информацию в облачном сервере. Это хранилище данных, которое не принадлежит хозяину информации. Такое размещение не дает гарантий по конфиденциальности и сохранности данных.
В собственном хранилище (сервере) для клиентов, у которых недопустима утечка информации. Например, персональные данные сотрудников или клиентов лучше хранить на своем сервере. Собственное хранилище убережет от потери ценной информации.
На арендованном сервере для клиентов, которые не хотят содержать инженера и комплекс сетевого оборудования. Если объем данных для BI-системы большой и требует дополнительного оборудования, то его можно арендовать.
В зависимости от стоимости
Бесплатные. Некоторые вендоры предоставляют свою BI-систему бесплатно, Пример: Yandex Datalens.
Дашборд BI-системы от «Яндекс» — Yandex Datalens
Условно-бесплатные. Стоимость определяется типом использования программы. Клиент использует облачную версию или серверную, пользователь — частное лицо или компания. Пример: QlikView.
Дашборд BI-системы QlikView
Платные. В основном вендоры продают свои системы, но для знакомства с программой предлагают бесплатные тестовые периоды. Пример: Klipfolio
Дашборд BI-системы Klipfolio
Как выбрать BI-систему
Выбор BI-системы зависит от масштаба компании, направления бизнеса, её запросов и квалификации сотрудников.
- Система должна быть удобной и понятной основным пользователям. Если программа окажется слишком сложной, пользователи будут часто обращаться за помощью в отдел IT. Половина преимуществ потеряются. Поставщики BI-систем предлагают пробные периоды для тестирования. В это время пользователи могут оценить удобство и сложность программы.
- Поставщик должен сообщить, что надо знать пользователю, чтобы он мог самостоятельно и быстро работать в ней. Нужно оценить, насколько сложно и долго обучать сотрудников работе с системой. Может ли компания позволить себе длительное обучение.
- Лучше, чтобы система была распространена в бизнесе. Если из компании уйдет единственный сотрудник, который умеет настраивать программу, то насколько это критично для работы. Легко ли подобрать ему замену. До 2022 года популярными системами были Power BI, Tableau, QlikView и Klipfolio. Сейчас с ними работать не получится. В России предлагают альтернативные программы, например BIPLANE24, AlmazBI, Modus и другие. При выборе системы следует проверить количество компаний, которые предлагают этот продукт. Чем больше продавцов, тем больше на рынке специалистов, которые умеют обслуживать систему.
- Система должна точно отвечать на специфические запросы компании. Например, у пользователя должна быть возможность полноценно взаимодействовать с объектами на мобильных устройствах. Программа должна позволить пользователю выбрать со смартфона несколько объектов и изучить их одновременно. Чтобы понять такие нюансы, нужно провести тесты в пробный период или спросить о возможностях программы у представителя компании продающей систему.
Как внедрить BI-систему: советы и ошибки
Сложность внедрения зависит от того, как компания раньше работала с источниками данных.
Компания не собирала и не систематизировала информацию . Систему придется настраивать целиком. Надо искать программы для хранения, обработки, очистки, извлечения, передачи, аналитики и демонстрации данных.
Компания собирала, систематизировала и хранила информацию , но не предоставляла её пользователям в понятном и наглядном виде. Например, пользовалась только таблицами Excel. В этом случае для внедрения BI-системы понадобится только софт для аналитики и предоставления информации, к которому подключаются все источники.
Ошибки при внедрении
Начать внедрение системы без точно сформулированных потребностей. Если потребности неизвестны, можно начать решать технические задачи без привязки к конечной цели. Информация, которую будет выдавать система после установки, будет бесполезной.
Отдать все процессы внедрения в IT. Это отдел, у которого всегда есть работа и принцип «работает — не трогай». Поэтому IT сотрудники могут откладывать внедрение системы на потом. Чтобы такого не происходило, им нужен куратор.
Источник: www.unisender.com
BI-системы: что это и зачем они нужны бизнесу
На международных рынках компании-гиганты работают с миллионами, десятками, а кто-то — и с сотнями миллионов клиентов. С помощью интернета обо всех этих клиентах можно собирать самые разные данные: возраст, пол, образование, вкусы, предпочтения и т. д. Анализ этих данных помогает менеджерам ориентироваться в пространстве и времени, планировать спрос, оценивать перспективы развития и прорабатывать стратегии.
Компаниям нужно много данных, и за их хранение, как правило, отвечают администраторы баз данных. На основании анализа данных строятся и проверяются гипотезы для развития бизнеса. Этим занимаются аналитики.
В последнее время эти две группы всё чаще дополняются отделами Business Intelligence — бизнес-аналитики. Эти специалисты приводят сырые, неудобные данные в состояние, пригодное для бизнес-анализа. Сырые данные необходимо очищать от различных выбросов, дублей и других помех. А учитывая их объём, частое обращение к этим данным будет отнимать слишком много ресурсов.
Для изучения бизнес-метрик не нужны вообще все данные. Например, чтобы получить ежедневную динамику новых пользователей приложения, не нужны их id, пол и местоположение. Достаточно сделать таблицу, в которую для каждого дня проставляется количество новых пользователей — оно будет суммироваться. Таблица будет обновляться в нерабочее время, а днём сотрудники смогут работать с нужной статистикой.
Специалисты по BI готовят таблицы агрегированных данных (витрины), строят отчёты на основе полученных витрин (дашборды) и настраивают автоматическое обновление данных в этой системе. От стандартных отчётов дашборд отличается гибкостью и интерактивностью — в нём предусмотрены разные наборы фильтров, параметров и визуализаций. Дашборд можно назвать интерактивной аналитической панелью, где заказчик может просматривать данные в любом интересующем его разрезе.
BI-разработчики не скажут, как повлияет на ваши продажи новый продукт конкурента, но построят систему, где вы сможете проверить это сами.
Основные задачи BI
Сбор данных. BI-системы позволяют строить сложные виды отчётности, где можно объединить в одну таблицу данные из разнообразных источников — базы данных, файлы, онлайн-источники (Google Docs) и т. д.
Очистка и агрегация. Агрегация данных помогает не только избавиться от лишней информации, но и сэкономить память. При работе с большими объёмами данных имеет смысл разделять нагрузку при запросах: на первом этапе агрегируем данные и складываем в таблицу, на втором делаем запрос к этой таблице из дашборда.
Визуализация. BI-инструменты предоставляют множество вариантов визуализации данных: от обычных таблиц до различных Scatter Plots, которые можно применять для практически любого анализа. Нередко BI-инструменты дают возможность связывать различные визуализации друг с другом. Например, есть два графика с одинаковой цветовой легендой.
Можно настроить так, чтобы при выделении одного из элементов легенды на первом графике этот же элемент подсвечивался/фильтровался на втором. Такие приёмы существенно ускоряют поиск нужной информации и упрощают анализ.
Быстрый доступ. Быстрый доступ к данным — огромная помощь в оперативном принятии решений. BI-разработчик может использовать единое пространство для дашбордов или другой инструмент — в любом случае доступ к информации значительно упрощается. Можно не ставить задачу аналитику, не писать собственноручно запрос к базе данных — достаточно открыть дашборд и отфильтровать там необходимую информацию. Особенно хорошо, если доступ к данным предоставляется в режиме реального времени.
Распределение доступа. BI-системы обычно располагают различными средствами распределения доступа, что помогает гибко настраивать процесс получения данных. Например, один и том же дашборд можно настроить так, чтобы разным пользователям были видны разные блоки данных.
Хорошо настроенная BI-система снимает с аналитиков и продуктовых команд часть нагрузки и освобождает время, которое они тратят на оперативную отчётность или постоянно повторяющиеся запросы к базе данных. Если формат отчётности зафиксирован, можно построить дашборд в соответствии с ним, и все необходимые данные будут отображаться автоматически. Один дашборд заменит множество еженедельных отчётов. Он будет хранить весь объём данных и заказчик сможет сам отфильтровать нужную ему информацию вместо того, чтобы ждать, пока эти данные ему пришлют.
Из чего состоят BI-системы?
BI-системы можно разделить на три основные составляющие:
Хранилище данных — база с сырыми и агрегированными данными, которые будут источником для аналитики (как для запросов к базе, так и для дашбордов).
ETL-система (Extract, Transform, Load) отвечает за подготовку и сбор агрегированных данных в витрины. Обычно это набор скриптов на языке программирования, каждый из которых берёт сырые данные из одних таблиц хранилища, обрабатывает их и отправляет в другие. Также ETL-система может использоваться для административных задач, например для резервного копирования или регулярного обновления дашбордов. ETL-системы может не быть, если в дашборд надо загружать небольшой объём данных и если не требуется использовать сложные запросы к БД.
BI-сервер/BI-инструмент. Почему через слеш? Потому что есть два основных подхода — поднимать BI-сервер или использовать только BI-инструмент.
BI-сервер — это место для хранения дашбордов, средство визуализации, а также система распределения доступов и автоматического обновления. Сотрудники строят дашборды у себя на компьютере, загружают результат работы на сервер, настраивают расписание обновления и права на просмотр.
BI-инструмент — это программная платформа для построения дашбордов и визуализаций. В этом случае компании экономят: не используют сервер, а строят дашборды на локальных компьютерах, загружают их в общее пространство (например, Git), а обновление дашбордов и отправку информации целевым пользователям настраивают в ручном режиме или с помощью языков программирования.
Хранение отчётов и данных в единой BI-системе обеспечивает прозрачную инфраструктуру и облегчает поиск информации.
О чём нужно подумать при внедрении BI
Проанализируйте источники данных, их объём и тип. Это позволит оценить необходимость разработки ETL-системы и правильно выбрать BI-инструмент.
Выберите BI-инструмент, подходящий вашим целям. Инструменты различаются возможностями визуализации, разнообразием источников данных, ценами и т. д. Самые известные инструменты рассмотрены в статье на Хабре. Также проанализируйте аудиторию будущих пользователей BI-системы, подумайте над распределением прав доступа и шаблонами дашбордов.
Определите необходимость разработки ETL-системы. Она зависит от того, насколько сложны запросы к данным и насколько большой их объём требуется анализировать. Если объём велик, для бесперебойной работы потребуется распределять нагрузку между BI-сервером и ETL-системой. Часто предобработку и агрегацию данных делают в ETL-системе, а в BI строят дашборды, опираясь на уже собранные таблицы. Это ускоряет работу и даёт возможность использовать агрегированные таблицы для нескольких отчётов одновременно.
Подумайте о правильной документации для своих дашбордов, о том, как обучить сотрудников ими пользоваться — например, запишите видеоинструкции.
Если вы хотите освоить BI-системы во всех подробностях, приглашаем на курс GeekBrains. Там подробно разбирается профессия BI-разработчика — от написания запросов к данным до построения всей инфраструктуры.
Заключение
Часто компании не решаются внедрять BI-системы из-за сложности развёртывания инфраструктуры с нуля. Это стандартная проблема смены парадигмы. Вроде и так всё работает, отчётность получаем вовремя — и хорошо. Однако развёртывание BI-систем — это серьёзная инвестиция в будущее компании, помогающая внедрить data-driven-подход — управление, основанное на данных.
Его главный принцип: решения нужно принимать, опираясь на исторические и прогнозируемые данные, а не на интуицию и личный опыт. BI-системы внедряются небыстро, но если у всех сотрудников будет доступ к необходимым данным за любой период времени, это упростит принятие стратегически верных решений и многократно окупится. Не измеряешь — не управляешь.
Источник: gb.ru
Системы бизнес аналитики это
Метод ETL
Хорошо, если в таблицах нет пропущенных значений, дубликатов, аномалий и сам массив данных самодостаточен – по нему можно решить задачу анализа без обогащения массива данными из внутренних или внешних источников. Так бывает не всегда. Поэтому для подготовки данных к анализу BI-аналитики применяют шаг Transform (очистка данных) из метода предобработки ETL (англ. Extract, Transform, Load – «извлечение, преобразование, загрузка»):
- получение данных;
- преобразование, очистка данных;
- и загрузка их в хранилище или аналитическое приложение.
Языки Python и R
Из языков программирования приоритет отдается Python и R . Язык R изначально разработан для анализа и статистической обработки данных. В Python для работы с данными используют библиотеку pandas, а для визуализации множество других библиотек: matplotlib, plotly, seaborn, bokeh, altair, ipyleaflet, folium.
Подробнее о работе с Pandas и визуализации данных читайте в наших статьях:
- Инструменты дата-журналиста #1: Jupyter Notebook и библиотека Pandas
- Инструменты дата-журналиста #2: веб-скрапинг, парсинг и визуализация данных
- Работа с геоданными в Python и Jupyter
Отображение рез ультатов в визуальном формате – графики, диаграммы или на карте – дает представление о наиболее важных показателях, которые не всплывают в контексте таблицы. Информации много, поэтому вручную писать код для каждого графика занимает много времени. Чтобы клепать отчеты в промышленных масштабах BI-аналитик пользуется платформами с функциями хранилища данных, автоматизированной отчетности и построения дашбордов.
Что такое дашборд
Дашборд – приборная панель с интерактивными графиками и диаграммами (рис. 2).
Один из главных инструментов аналитика – специальные BI-платформы.
Популярные BI-платформы
На некоторых платформах удобнее рисовать графики, на других сводить данные, а у третьих крутая кривая обучения, чтобы полностью использовать их возможности. Учитывая, что платформы в 9/10 случаев платные, нужно определиться, какой функционал нужен. В вакансиях на Хедхантере чаще всего фигурируют Tableau и Power BI.
Microsoft Power BI
powerbi.microsoft.com | Цена : Power Desktop распространяется бесплатно, Pro-версия стоит от 625 ₽/мес.
Power BI Desktop – часть набора продуктов Power BI. Desktop-версия устанавливается на локальный компьютер и позволяет подключать, преобразовывать и визуализировать данные. Power BI Pro – продвинутая версия с большим функционалом.
Функциональность Pro-версии :
- отчеты в реальном времени;
- предсказательная аналитика;
- расширенная аналитика на основе искусственного интеллекта (ИИ);
- создание моделей машинного обучения;
- очистка данных с помощью Azure Data Lake;
- больше инструментов интеграции данных по сравнению с платформой Tableau;
- интерактивные отчеты;
- бесшовная интеграция с технологиями Microsoft Office.
Tableau
C 2003 г. Tableau помогает не техническим специалистам создавать визуальную аналитику и интерактивные графики. Система имеет интуитивный и не загроможденный пользовательский интерфейс.
Функциональность :
- анализ в режиме реального времени;
- drag-and-drop конструктор в дашбордах;
- единый синтаксис для всех задач;
- обработка естественного языка (NLP);
- удобная работа с геоданным по сравнению с Power BI.
Qlik
Qlik – дает доступ к облачной аналитике с низким порогом вхождения и прозрачной ценовой политикой в отличие от Tableau (pdf, англ., шестая страница).
Функциональность :
- дашборды;
- геоаналитика;
- аналитика, основанная на поиске и языковых запросах;
- заказная разработка и встраиваемая аналитика;
- мобильная аналитика;
- автоматизация хранилищ данных;
- экспорт данных в Tableau, Power BI и другие аналитические системы.
Oracle Analytics Cloud
Oracle Analytics Cloud предлагает комплексную бизнес-аналитику, формирование отчетности, машинное обучение из коробки и возможности визуализации данных.
Функциональность :
- расширенная аналитика за счет средств ИИ и машинного обучения;
- обработка естественного языка (NLP);
- аналитические панели, дашборды;
- мобильные решения;
- предсказательная аналитика;
- бесплатно: две базы данных, хранилище на 100 Гб, две виртуальные машины с 1 Гб ОЗУ.
Metabase
metabase.com | Цена : бесплатно на своем хостинге или от 85 $/мес. за облако.
Metabase – инструмент бизнес-аналитики с открытым исходным кодом. Он не требует знания SQL и имеет приятный интерфейс, позволяющий создавать аналитические графики всего несколькими щелчками мыши.
Функциональность :
- установка за 5 минут;
- создание запросов без знания SQL;
- отправление данных по расписанию на электронную почту или в Slack
- просмотр данных с помощью бота MetaBot в Slack;
- работа с геоданными;
- оповещение об изменениях.
Литература
- Визуализируйте это: Руководство FlowingData по дизайну, визуализации и статистике – Натан Яу (англ.);
- Визуализация данных (практическое руководство) – Киран Хили (англ.);
- Основы визуализации данных: руководство по созданию информативных и убедительных диаграмм – Клаус О. Вильке (англ.);
- Super Graphic. Вселенная комиксов сквозь схемы и диаграммы – Леонг Тим;
- Искусство цвета – Йоханнес Иттен;
- Наглядная математическая статистика. Учебное пособие – Лагутин М. Б.
Интернет-ресурсы и YouTube-каналы
- Каталог Визуализации Данных – сборник диаграмм и графиков;
- Vitamin Business Intelligence – BI для начинающих: управление, анализ и визуализация данных (англ.);
- Business Intelligence, Big Data и человеческое чутье – на канале рассказывают о видах BI, технологических средствах реализации и подводных камнях;
- Создание дашборда в Power BI – полное руководство по созданию дашборда;
- Tableau. Основы. Создаем дашборд – инструкция по сборке простого дашборда;
- Вебинары и уроки по Qlik – 42 видео, плейлист регулярно обновляется: первое видео датируется 2016 г., последнее – 2021 г.;
- Канал Oracle Analytics – официальный канал Oracle Analytics, в котором рассказывают о новых возможностях системы и показывают как ими пользоваться (англ.);
- Туториал по Metabase – здесь вы узнаете, как установить систему и как с ней работать.
Резюме начинающего BI-аналитика
Зарплата : от 60 тыс. руб. (актуально на момент публикации статьи в г. Москва).
- навык работы с базами данных и написания SQL-запросов средней сложности;
- знание аналитической системы Power BI / Tableau;
- умение разрабатывать ETL-скрипты для очистки, обработки и выгрузки данных;
- знание программ MS Office на уровне уверенного пользователя;
- аналитический склад ума;
- английский язык на уровне чтения документации.
Если вас вдохновляет Big Data, срезание, сведение и перемещение блоков информации, механизмы селекции бизнес-процессов или просто капитализм, то, возможно, профессия BI-аналитика – ваше призвание.
Хочу научиться программировать с нуля, но не знаю, с чего начать. Что делать?
Можно учиться самостоятельно (долго) или пойти на курсы с преподавателями (быстро). Плюс нужно учитывать, что джунов много, конкуренция выше и работодатели повышают порог вхождения при найме на работу. Чтобы получить актуальные знания, мы в proglib.academy запустили курсы:
- Основы программирования на Python.
- Профессия Python-разработчик.
- Алгоритмы и структуры данных.
- Математика для Data Science.
- Профессия Data Science.
- Frontend Basic: принцип работы современного веба.
- Профессия Фронтенд-разработчик.
- Обработка естественного языка. Полный курс.
На подходе еще больше 10 курсов для взрослых и детей.
Источник: proglib.io