Как data science помогает бизнесу

Здравствуйте. На связи Людмила — маркетолог компании Altcraft. За секунду Google обрабатывает более 99 тыс. поисковых запросов, а в Instagram загружается от тысячи фото — объём данных в интернете растёт с космической скоростью. Данные везде, и это ресурс для бизнеса и маркетинга. Data science обрабатывает, анализирует данные и отвечает на вопросы бизнеса в ритейле, в промышленности, в банкинге и других сферах.

1458 просмотров

Направление появилась в 70-х годах прошлого века и изучало жизненный цикл данных. В 2010-х компьютеры научилась обрабатывать огромные объёмы информации. Тогда значение науки о данных возросло, дисциплину начали включать в программы мировых университетов.

Сейчас дата сайенс — помощник бизнеса и двигатель инноваций. В статье разберём, что такое Data science, как применяют науку о данных в бизнесе и маркетинге.

Что такое Data Science

Data science — это область знаний, которая изучает и анализирует данные, ищет закономерности для принятия решений на практике. Наука о данных — не совсем наука. Данные — не предмет Data science, а ресурс для получения знаний с методами из других дисциплин: бизнес-аналитики, математики, статистики, программирования, стратегического планирования, системного анализа. Дата сайенс тесно связана с понятиями искусственного интеллекта (AI), машинного обучения (Machine Learning), Big Data и Deep Learning.

Data Science и технологии для работы с данными

Данные Data science получает из интернета, со смартфонов и умных устройств, от специальных датчиков. Другие источники — корпоративные логи, архивы, истории транзакций. Инструменты для data scientists — программное обеспечение, которое обрабатывает, структурирует, анализирует данные и визуализирует их в понятном для конечного пользователя формате.

Дата сайнс смотрит в будущее — строит прогнозы на основе данных. Предсказывает спрос на товары, поведение пользователей в приложении, развитие болезни пациента клиники, прогнозирует климатические катастрофы и другие события.

Как работает Data Science

Data science обрабатывает данные для анализа: организует, агрегирует и оформляет их для непрофессиональных пользователей. Дата сайентист извлекает информацию из массивов обработанных данных, чтобы найти закономерности, построить гипотезы и смоделировать картину будущего.

Как работает Data science по этапам:

Зачем Data Science бизнесу

Data science отвечает на конкретные вопросы бизнеса — проверяет гипотезы и идеи. Наука о данных:

  • учитывает объём информации, который не способен обработать для принятия решений человек;
  • исключает субъективное мнение в принятии решений.

Беспристрастный ответ на бизнес-вопрос — защита от ошибок и заблуждений. С дата сайнс главное — не авторитет руководителя, а факты.

Data science для бизнеса также:

  • Изучение целевой аудитории. Компания, которая знает клиента на отлично, предлагает правильные продукты и обгоняет конкурентов.
  • Прогнозирование трендов — инсайты для новых сервисов и продуктов.

Как используют науку о данных в бизнесе

Промышленность

Data science прогнозирует спрос и отвечает на вопрос, как оптимизировать цепочки поставок. Снижает риски избытка товара при низком спросе и недостатка при больших заказах. На основе данных производство эффективно распределяет ресурсы, контролирует расходы и доходы, находит уязвимые места — причины брака. Предиктивная аналитика покажет, когда оборудование выйдет из строя из-за изнашивания деталей и укажет, когда провести ремонт, чтобы этого не допустить.

Логистика и транспорт

Оптимизация цепочек поставок: сокращение времени доставки, поиск оптимальных маршрутов и снижение расходов на эксплуатацию. Как в промышленности, изучение данных прогнозирует спрос на услуги транспортных компаний. С Data science оптимизируют пространства складов и снижают риски ошибок хранения и перемещения товаров.

В транспорте Data science предсказывает объём пассажиропотоков, загрузку транспортных средств и обеспечивает безопасность — предугадывает поломки и аварии.

Пример. Компания РЖД для прогноза опасных отказов объектов железнодорожного пути внедрила технологии Data science. Алгоритмы моделируют ситуации с более 50 факторами, оценивают состояние путей, техническое состояние составов и указывают на области для срочного ремонта, чтобы избежать аварий и крушения поезда.

В розничной торговле Data science обеспечивает:

  • прогноз спроса на группы товаров;
  • контроль за акциями — определяет, когда их стоит проводить;
  • изучение трендов и потребностей аудитории по данным соцсетей и информации о конкурентах;
  • индивидуальные предложения: какой товар предложить как альтернативу или для допродажи;
  • прогноз цен.

Сотовые операторы

Телеком ставит задачу для Data science по персонализации сервисов и продуктов. Данные подсвечивают, что важно для клиента, как оптимизировать пакеты услуг. Также сотовые операторы на основе данных определяют, где лучше размещать салоны связи и сотовые вышки.

В компаниях из сфер телекоммуникаций работают собственные отделы Data science, которые создают цифровые решения не только для внутренних потребностей бизнеса.

Пример. Оператор МТС предлагает клиентам сервис для развития туристического потенциала, который анализирует 5000+ метрик для сегментации аудитории.

В банках data scientists исследуют данные для определения кредитного потенциала клиентов. Непогашенные вовремя кредиты — риски для банков. Data science прогнозирует, как поведёт себя клиент в зависимости от ситуации на рынке, оценивает надёжность заёмщика. С данными банки персонализируют сервисы. Алгоритмы определяют интересы пользователя по действиям и предлагают услуги, которые клиент сам и не искал.

Важная задача для Data science — поиск действий мошенников. При операциях на большую сумму система может приостановить транзакцию и попросить подтверждение от клиента. Под подозрение попадут нетипичные покупки, несколько учётных записей с похожими данными.

Читайте также:  Как настроить таргет на бизнес

Недвижимость

В этой сфере изучение данных не ограничивается предложением подходящих вариантов недвижимости покупателю. Data science анализирует документацию объектов: зданий, земельных участков. Данные прогнозируют спрос на недвижимость, цену на заданной территории, а инвесторы решают, в какие объекты стоит вкладываться.

Данные ускоряют поиск жилья для аренды в сервисах. Пример. Airbnb анализирует информацию от пользователей: варианты, которые те просматривали и какие в итоге выбрали. Data science прогнозирует вероятность бронирования в определённых районах города.

Карта с данными вероятности бронирования в Сан-Франциско по данным Airbnb
Как используют науку о данных в маркетинге

Оптимизация площадок

Data science покажет, как пользователи ведут себя на интернет-площадках: на сайтах, в приложениях и в соцсетях. На основе данных компания понимает, как упростить процесс покупки, какие элементы добавить, чтобы продукт стал привлекательнее для клиента. Какие функции использовать, чтобы улучшить сервис. Дата сайенс указывает на удачный и неэффективный контент на ресурсах компании: какие материалы дочитывают до конца, а какие пролистывают.

Изучение аудитории и персонализация

Наука о данных детально изучает клиентов: интересы, предпочтительные каналы коммуникации, поведение на интернет-ресурсах и офлайн. Знания об аудитории усиливают персонализацию предложений: компания знает, где клиент лучше реагирует на рекламу, на какие объявления реагирует, как организовать кросс-продажи и допродажи.

С Data science маркетологи детально сегментируют аудиторию по десяткам параметров, чтобы прицельно работать с каждой группой. Например, предлагать товар, когда это актуально. Если знать, когда после покупки у клиента заканчивается продукт (корм для животного, бытовая химия, охлаждающая жидкость для автомобиля и так далее), то реклама продукта в нужный момент — шанс на успех.

C Data science маркетинг получает real-time аналитику и быстро адаптируется к новой ситуации — меняет стратегию. Ускоряется планирование будущих кампаний. Прогнозы на основе данных ответят, как будет происходить ценообразование и какую цену выбрать для сохранения и увеличения объёма продаж.

Оптимизация бюджета

Точная аналитика и предсказуемость поведения потребителей экономит деньги компании. Реклама эффективно отрабатывает бюджет — показывается вовремя и на нужной площадке. С Data science маркетологи знают, какой контент интересен аудитории, и не тратят ресурсы на создание ненужного. Всегда есть данные для прогноза будущих кампаний и оптимизации текущих.

Лояльность и удержание клиентов

Привлечение нового клиента стоит дороже, чем сохранение действующего. Data science укажет на момент, когда клиент теряет активность или прекращает общаться с компанией. Когда компания знает жизненный цикл клиента, то вовремя отправляет персонализированные предложения или полезный контент для удержания.

Data science изучает данные, отвечает на вопросы бизнеса и маркетинга для проверки гипотез, теста идей, запуска новых продуктов и сервисов.

В бизнесе Data science — инструмент для объективного принятия решений вместо интуитивных действий или субъективного опыта. Наука о данных анализирует информацию об аудитории для создания новых сервисов и продуктов. В маркетинге дата сайнс — это оптимизация площадок и бюджетов, персонализация предложений, инструмент для аналитики.

Data scientists работают в промышленности, в логистике, в банкинге, в телекоме и других областях, где возможно собирать и анализировать данные, а потом применять их для бизнес-целей.

Источник: vc.ru

Зачем бизнесу data science

Встретились как-то продакт с дата-сайентистом в одном офисе и стали выяснять, кто для бизнеса нужнее. Об этом в нашем видеоблоге вышел огромный выпуск, который я решил переделать в статью. Если интересно послушать полный диалог со всеми подробностями – добро пожаловать.

Всем привет! Меня зовут Игорь Уткин, я – дата-сайентист в hh.ru. В этой статье разбираемся: когда компании может понадобиться дата-сайентист, имеет ли собранная модель право на ошибку и как вообще люди уходят в data science.

Кто такие дата-сайентисты

Дата-сайентисты – это люди, которые работают с данными и пытаются найти в них связи, которые помогут объяснить некоторые процессы, снизить неопределенность в бизнесе, насколько это возможно.

При поверхностном гуглении разных определений data science можно наткнуться на любопытную картинку.

На ней три большие области знания: математика, бизнес и computer science, по-русски – информатика. Если соединять эти кружочки между собой, на их пересечении складывается некоторая область специализации.

Например, на пересечении математики и бизнес-экспертизы возникает дата-аналитика, на пересечении информатики и бизнеса – разработка программного обеспечения, на пересечении информатики и математики – чистый machine learning. Там, где пересекаются все три кружка, возникает область data science. Дата-сайентист – это некий сплав программиста, математика и специалиста в некой профессиональной технической области. Сегодня эта специальность делится уже на более узкие специализации, вроде Data Engineer, Data Scientist, Data Analyst и т.д. Все они так или иначе на базовом уровне обладают схожими компетенциями.

Как я попал в data science

Всё началось с аналитики. Когда-то я был обычным администратором баз данных, а несколько позже стал отвечать за формирование отчетов в финансовом подразделении. Там я не только складывал циферки, но и решал, где все необходимые данные достать и где их потом хранить. Потом руководство захотело помимо обычных ежемесячных и еженедельных отчетов получать на их основе еще финансовые прогнозы. И их надо было как-то делать.

Читайте также:  Бизнес администрирование что сдавать

Я стал интересоваться и изучать существующие методы – вряд ли человечество формулирует этот запрос впервые. Можно сказать, уже тогда я потихоньку превращался во всамделишнего дата-сайентиста, просто еще об этом не знал. Затем мне довелось поработать системным аналитиком, и там появилось более глубокое понимание продукта и где лежат данные.

И уже в 2013 году, на волне хайпа big data на моем предыдущем месте работы сформировался Департамент анализа данных, где появились полноценная должность дата-сайентиста. Тогда-то я впервые и стал так называться.

Нам нужен дата-сайентист

Компания редко ищет людей на должности просто чтобы они были, компании всегда нужна прибыль. От того, что она примет в штат пятерых дата-сайентистов и будет им платить огромную зарплату, прибыль сама по себе не то что не вырастет, а скорее всего даже упадет. Бизнес должен сам понять насколько он созрел для наёма дата-сайентиста и с какой целью такой специалист ему нужен.

Однозначно нельзя перепрыгнуть определенные уровни, на которых в компании развита IT инфраструктура и культура работы с данными. Если у вас нет данных, скорее всего у вашего дата-сайентиста либо ничего не получится, либо он потратит очень много времени, чтобы эти данные хотя бы получить.

Бизнес должен понять, что дата-сайентист – это не волшебник. Он не обладает магическим свойствами в достаточной степени, чтобы смотреть в хрустальный шар и изрекать пророчества. Если нужны более-менее точные прогнозы, для них требуется твердая аналитическая база и много-много данных.

Данных много не бывает. Чем их больше – тем лучше. Но даже если у вас уже есть данные они могут оказаться не подходящими, ошибочными или иметь не достаточную детализацию. Трудно учесть всё сразу, поэтому можно отталкиваться от задачи и прийти к дата-сайентисту просто с оформленной идеей и минимальным понимаем того, что хочется получить в итоге. Он уже сформирует требования к данным которые ему понадобятся.

Когда у вас есть данные, вы уже можете попытаться что-то прогнозировать, посчитать, вывести и сравнить. Дальше вы оцениваете выхлоп – приносит ли ваша деятельность какой-то результат и что вам это дает. Понимаете, как качество прогнозов влияет на профит, и можно ли его конвертировать в деньги.

Как только мы получаем необходимые прогнозы, бизнес должен быть готов их внедрять и проверять на практике. Вот пара плохих примеров когда все хорошо поработали а толку 0.

Кейс №1

Моей задачей было построить модель, которая оптимизирует количество и расположение офисов в произвольном населенном пункте. Семь месяцев ушло только на то, чтобы собрать хоть какую-то выборку для обучения. Начальство уже оказывало моральное давление в формате: «пора бы поторопиться, мы тебе платим большие деньги».

И вот — модель готова, мы выдаем рекомендации, где что открыть и где закрыть. Выясняется, что мы ничего закрыть не можем, ибо мораторий на закрытие, и открыть тоже — денег в бюджете на это нет. Великолепно!

Кейс №2

По заказу бизнеса строили систему прогноза закупок, строили долго — около двух лет и при помощи внешних консультантов. Когда все было сделано, выяснилось, что за закупки отвечает другой Департамент, а они не очень-то и ждали наши прогнозы. И вот зачем это всё было?

Хороший дата-сайентист понимает, какая модель лучше подойдет для бизнеса: более простая или архисложная. И это здесь нужен максимально обоснованный и индивидуальный подход. А бизнес, в свою очередь, должен понимать минимальный размер эффекта, ради которого он готов нанять специального человека. Одному бизнесу 1,5% – это критично, а другому от такой мелочи ни холодно, ни жарко.

Data science принесет пользу лишь в том случае, когда будет иметь реальные рычаги влияния на те параметры, которые собирается анализировать и использовать. Мы должны как минимум брать такие фичи в построении нашей модели, на которые можем повлиять сами или руками ближайшего руководства.

Сегодня хорошего дата-сайентиста может себе позволить в первую очередь богатый большой бизнес, у которого есть желание поиграть с данными, чтобы потенциально увеличить выручку, либо бизнес поменьше, но с четким пониманием, зачем именно нужен такой специалист.

Ошибки будут всегда!

Нужно понимать, что нет никакого волшебного решения – любая модель всегда ошибается. Просто какие-то модели ошибаются чаще, но меньше, а другие реже, но сильнее. У меня есть простой пример. В каждом уважающем себя торговом центре на входе стоит металлоискатель.

Допустим, этот металлоискатель ищет какой-то особый металл или сплав, наличие которого сигнализирует о том, что у человека с собой оружие или бомба. В таком кейсе решается задача бинарной классификации и вот тут может возникнуть две ошибки: их называют ошибками первого и второго рода. Ошибка первого рода – это ложноотрицательный результат, когда у человек с собой запрещенный предмет , но детектор не запищал, а когда у человека нет ничего запрещенного, но детектор пищит – это ошибка второго рода (ложноположительный результат). Идеального детектора нет и всегда приходится идти на компромисс между двумя этими ошибками и этот компромис должен определять заказчик в зависимости от своих бизнес задач.

Читайте также:  Какие функции могут более эффективно исполняться в новых бизнес объединениях

Когда нас интересует конкретная цифра, нет ошибок первого и второго рода, а есть просто ошибки: либо мы ошиблись в плюс, либо в минус. Если мы прогнозируем курс акций на завтрашний день, нам хочется, чтобы прогноз был в диапазоне “± несколько копеек”, а не “± 10 долларов” к цене.

Даже самая крутая модель иногда все равно будет допускать ошибки, которые эксперту покажутся крайне глупыми и по одному такому примеру делается вывод, что модель плохая. Чтобы этого избежать, нужно заранее согласовать с заказчиком метрики качества моделей и оценивать качество на большом количестве примеров.

Это всегда нужно держать в голове, потому что бизнес любит за такое цепляться. Он хочет, чтобы ошибок не было. Но зачастую это либо невозможно, либо очень дорого обходится – убрать крайние случаи и как-то их уменьшать. Иногда лучшего решения просто не существует, потому что никто не знает, как это сделать.

Сейчас есть куча платформ, которые позволяют бизнесу выстроить задачу на аутсорс, когда, например, штатные дата-сайентисты уже не могут предложить лучшее решение. Буквально недавно видел: у одной компании появилась потребность в умной архивации данных. Организация публикует конкурс, где выдает данные, которые хочет сжать до минимально возможного размера: сейчас она может сжать их до одного гигабайта, но все, кто сделает лучше, получат 5000$. И есть люди, которые готовы тратить своё время на негарантированный приз.

Кто ставит задачи

Если нет тимлида, задачи приходят от продакта. Бизнес не всегда может сразу правильно поставить задачу, поэтому я могу (и порой должен!) ее корректировать. Иногда приходится указывать бизнесу на недочеты, которые не позволят получить тот результат, который ему нужен. Я предлагаю альтернативу, и если с ней соглашаются, то мы работаем уже с обновленной задачей.

А если бизнес не приходит, я ставлю себе задачу сам, и чаще всего это чистый ресерч. Я прокачиваюсь, изучаю, получаю опыт, а затем могу сам предложить решения бизнес задач.

Где искать дата-сайентистов

Есть российское сообщество – Open Data Science. У этого сообщества есть Slack-канал. Там собраны люди с общими интересами и там же часто размещаются объявления о вакансиях. Человек с улицы туда просто не попадет, просто потому что не знает, что ему туда надо.

Там уже собран нужен контингент, и работодателю там гораздо проще найти релевантного кандидата. И больше шанс, что это будет действительно хороший специалист, учитывая среду.

Еще можно искать крутых специалистов у нас на hh.ru, например.

Как стать дата-сайентистом

Я в некотором роде самоучка — когда мне понадобилось создавать модели и прогнозы, еще не было никаких курсов. Сейчас с этим гораздо проще – море учебников, курсов и вообще чего угодно, что призвано научить этой специальности.

С одной стороны благодаря этому выучиться стало сильно легче, а с другой – информации настолько много, что теперь сложно найти действительно ценную информацию и отфильтровать всё лишнее.

Я не думаю, что человек, который закончит даже платные курсы, сразу станет хорошим дата-сайентистом. Здесь нужен крепкий практический опыт. Все курсы только знакомят с алгоритмами в тепличных условиях. Уже есть данные, определена метрика качества – что нужно улучшать. В реальной жизни часто так бывает, что нет данных, вы не знаете ни где их достать, ни как мерить.

Зачастую дата-сайентист логически вырастает из программистов и аналитиков. У них уже есть необходимая база, которую нужно просто подтянуть или расширить в смежные области. Нужен математический склад ума, желание разбираться со всякими техническими штуками, знать английский – все передовые технологии описаны не на русском. А все переводы доходят с опозданием – информация в них может к этому времени растерять актуальность.

На заметку работодателю

Круто, когда в вакансии пишут честно и без прикрас: да, у нас есть вот такие задачи, но хромает здесь и здесь. Такая вакансия будет разительно выделяться из большинства, и потенциальный сотрудник сразу будет видеть трудности, с которыми придется столкнуться. Иначе просто потеряете время и деньги, потому что человек приходит на обещанное, а потом его ставят перед неприятным фактом.

И хорошему специалисту всегда видно, когда вакансию пишет HR по усредненному шаблону, а когда перед тобой действительно честное и прозрачное объявление.

Что в итоге

Дата-сайентистов стоит нанимать, когда у вас либо очень много денег, чтобы экспериментировать, либо когда существует четкое понимание, что именно может улучшить этот специалист.

Не стоит требовать от моделей 100% качества – ошибки могут быть всегда. И скорее всего будут. Держите это в голове при постановке задачи, когда решаете, насколько вообще целесообразна разработка.

Хороший дата-сайентист может быть самоучкой, при условии, что у него математический склад ума и есть желание ковыряться в разных там технических штуках.

Ну и да – данных много не бывает. Но одни только данных недостаточно – всегда нужно понимание минимального профита, который устроит, и рычаги давления, чтобы что-то изменить.

  • Блог компании HeadHunter
  • Big Data

Источник: habr.com

Рейтинг
( Пока оценок нет )
Загрузка ...
Бизнес для женщин