Важное значение при изучении коммерческой деятельности имеет графическое изображение статистической информации. Правильно построенный график делает статистическую информацию более выразительной, запоминающейся и удобно воспринимаемой. В коммерческой деятельности графический метод находит широкое применение для иллюстрации сложившегося положения дел на рынке товаров и услуг, конъюнктуры спроса и предложения, рекламы товаров.
Применение графиков в статистике насчитывает более чем двухсотлетнюю историю. Основоположником графического метода в статистике коммерческой деятельности считают английского экономиста У. Плейфейра (1731 — 1798). В своих работах он впервые применил способы графического изображения статистических данных (линейные, столбиковые, секторные и другие диаграммы).
Статистические графики — это одно из самых наглядных средств представления информации, представляет собой чертеж, на котором при помощи условных геометрических фигур изображаются статистические данные. В результате этого достигается наглядная характеристика изучаемой статистической совокупности. Правильно построенный график делает статистическую информацию более выразительной, запоминающейся и удобно воспринимаемой.
Зачем нужны статистики? // Анализ бизнеса и мотивация персонала 16+
В статистическом графике различают следующие основные элементы:
· пространственные и масштабные ориентиры;
Полем графика является место, на котором он выполняется. Это листы бумаги, географические карты, план местности и т.п. Поле графика характеризуется его форматом (размерами и пропорциями сторон). Размер поля графика зависит от его назначения.
Графический образ — это символические знаки, с помощью которых изображаются статистические данные (линии, точки, прямоугольники, квадраты, круги и т.д.). В качестве графического образа выступают и объемные фигуры. Иногда в графиках используются негеометрические фигуры в виде силуэтов или рисунков предметов.
Пространственные ориентиры определяют размещение графических образов на поле графика. Они задаются координатной сеткой или контурными линиями и делят поле графика на части, соответствующие значениям изучаемых показателей.
Масштабные ориентиры статистического графика придают графическим образам количественную значимость, которая передается с помощью системы масштабных шкал.
Масштаб графика — это мера перевода численной величины в графическую (например, 1 см соответствует 100 тыс. руб.). При этом чем длиннее отрезок линии, принятой за числовую единицу, тем крупнее масштаб.
Масштабной шкалой является линия, отдельные точки которой читаются как определенные числа. Шкала, по которой отсчитываются уровни изучаемых показателей, как правило, начинается с 0. Последнее число, наносимое на шкалу, несколько превышает максимальный уровень, отсчет которого проводится по этой шкале. При построении графика допускается разрыв масштабной шкалы. Этот прием используется для изображения статистических данных, имеющих значения лишь в определенных значениях.
Статистики как метод анализа бизнеса
Экспликация графика — это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа.
Классификация статистических графиков.
При всем своем многообразии статистические графики классифицируются по ряду признаков: способу построения, форме применяемых графических образов, характеру решаемых задач.
По способу построения статистические графики подразделяются на диаграммы, картограммы и картодиаграммы.
Диаграмма представляет чертеж, на котором статистическая информация изображается посредством геометрических фигур или символических знаков.
Диаграмма сравнения — показывает соотношение признака статистической совокупности.
Рис. 3.2. Столбиковая диаграмма сравнения
Каждое значение изучаемого показателя изображается в виде вертикального столбика. Количество столбиков определяется числом изучаемых показаний (данных). Расстояние между столбиками должно быть одинаковым. У основания столбиков делается название изучаемого показателя.
Рис. 3.3. Полосовая диаграмма сравнения
В этих диаграммах основания столбиков располагаются вертикально. Должна быть одинаковая ширина полос.
Эту же диаграмму можем построить иначе (рис. 3.4).
При построении столбиковых диаграмм используется, как и в линейных графиках, прямоугольная система координат. По оси абсцисс размещается основание столбиков. Их ширина может быть произвольной, но обязательно одинаковой для каждого столбика.
Рис. 3. 4. Столбиковая диаграмма сравнения
Основные требования построения данных диаграмм:
* соответствие столбиков по высоте, а полос — по длине, отображаемым цифрам;
* недопустимость разрывов масштабной шкалы и начала ее не от нулевой отметки.
Структурная диаграмма — позволяет сопоставить статистические совокупности по составу.
Рис. 3.5. Структурно-столбиковая диаграмма.
Рис. 3.6. Структурно-секторная диаграмма
(состав населения СССР в 1986г.).
Секторная диаграмма строится таким образом, чтобы каждый сектор занимал площадь круга пропорционально удельному весу отображаемых частей целого. Затем необходимо найти значения центральных углов (1%=3,6 градуса).
Пример построения структурно-секторной диаграммы
Вид культуры | Посевная площадь |
зерновые | 570,6 |
технические | 105,6 |
картофель | 27,9 |
кормовые | 299,0 |
ИТОГО | 1003,1 |
Определяем относительные величины структуры использования посевных площадей колхозами.
Зерновые — 570,6/1003,1*100%=56,9%; Картофель — 27,9/1003,1*100%=2,8% и т.д. Получаем следующие данные (табл. 3.7).
Вид культуры | Посевная площадь в колхозах, % |
Зерновые | 56,9 |
Технические | 10,5 |
картофель | 2,8 |
кормовые | 29,8 |
ИТОГО | 100,0 |
Определяем по данным об удельных весах посевных площадей, занятых под отдельными культурами, соответствующие значения центральных углов.
Зерновые 56,9*3,6 = 204,85
Технические 10,5*3,6 = 37,85
Картофель 2,8*3,6 = 10,15
Кормовые 29,8*3,6 = 107,35
Теперь строим секторную диаграмму, разделив круг на сектора, в соответствии с полученными значениями центральных углов, культуры:
Рис. 3.7. Структура посевных площадей в колхозах области (1989г.).
При изучении статистической информации о коммерческой деятельности на рынке товаров и услуг применяются так называемые радиальные диаграммы. Строятся они на базе полярных координат. Началом отсчета в них служит центр окружности, а носителем масштабных шкал являются радиусы круга.
Обычно в основе радиальных диаграмм лежат повторяющиеся годовые циклы с помесячными или поквартальными данными. Так, при изучении годового цикла с помесячными данными окружность делят радиусами на 12 равных частей. Каждому радиусу дается название месяца года, а их расположение подобно циферблату часов.
На каждом радиусе, в соответствии с установленным масштабом, наносятся точки, соответствующие изучаемым за каждый месяц данным. Полученные таким образом точки соединяются между собой линиями. В результате получается спиралеобразная линия, характеризующая внутригодовые циклы коммерческой деятельности.
Источник: studopedia.su
Как не врать с помощью статистики: основы визуализации данных
Не раз слышал мнение, что задача аналитиков — показать откровенно «грустные» цифры таким образом, будто всё идет по плану. Возможно, где-то так и происходит, но в геймдеве всё наоборот. Нам надо представить максимально объективные данные, чтобы в проекте принимались правильные решения. И сделать так, чтобы эти данные были поняты.
Часто это сложнее, чем привирать с помощью красивых графиков.
Поэтому я собрал несколько базовых принципов визуализации, которые применяю в работе (список источников в конце). Пригодится, если вы пишете отчеты, готовитесь к презентации или просто хотите донести смысл каких-то цифр. Главное: чтобы сделать хороший график, не нужно быть талантливым художником или виртуозно владеть matplotlib/ggplot2. Поехали.
Почему для хорошего графика достаточно обычного Excel (а иногда карандаша и бумаги)?
Это вытекает из единственной цели визуализации — донести вашу идею. Поэтому сразу: не бывает «красивых» или «правильных» графиков — либо они помогают донести идею, либо нет. И если нет, то каким бы красивым ни был график — он не нужен.
Процесс создания графика, который будет достигать своей цели, можно условно поделить на 4 шага [1]:
Все начинается с идеи. Что вы хотите, чтобы читатели или зрители поняли? Исходя из этого, выбирается тип диаграмм, потом к важным местам привлекается внимание и, убирается все, что мешает донести мысль.
Теперь подробнее по каждому пункту.
Идея
Начнем с формулирования идеи и того, как это влияет на графики. Посмотрите на каноничный пример: табличку «Объем продаж по регионам» с очень простым набором данных (8 цифр, 2 компании) [2].
В таком виде она сложна для восприятия и никакая идея из нее напрямую не следует:
Чтобы показать важные связи проще и нагляднее — нам понадобится диаграмма. И в зависимости от выбранного типа графика на первый план выйдет совершенно разная мысль.
Например, единственное, что мы можем считать при первом взгляде на график выше — то, что структура продаж у двух компаний различна. Чтобы считать любую другую информацию, придется разбираться глубже, а это никак не помогает донести мысль.
Другой график, те же данные:
Здесь, помимо разницы в структуре, мы уже показываем, как у компаний соотносятся доли продаж в разных регионах. Если читать его слева направо (так будет делать большая часть людей), то мысль будет следующей: у компании Б (слева) наименьшая доля продаж на юге, а у компании А (справа) — наибольшая. И наоборот на севере.
Если мы используем гистограмму этого вида, то внимание, в первую очередь, будет привлечено к сравнению компаний между собой: по доле выручки на севере компания Б опережает компанию А, на востоке и западе они конкурируют, а на юге компания Б отстает от компании А.
Одни и те же данные, всего 8 цифр, но в зависимости от подачи, они выражают разные идеи.
Поэтому — сначала формулируем мысль, а потом выбираем подходящий тип диаграммы.
Типы диаграмм
Пройдемся по самым часто встречающимся видам диаграмм (которые вы можете найти в Excel, любом BI или других аналитических инструментах) и посмотрим, для какого типа сравнений (и каких идей) их лучше всего использовать [2].
Начнем с «любимой» круговой диаграммы и вариациях (кольцевые диаграммы). В классической трактовке ее основная цель — сравнение долей при показе статичной структуры.
Составляющие хорошей игры
Но также есть мнение, что главная цель этой диаграммы — реклама и красивые картинки.
Во многом именно Pie Charts уже который год позволяют бизнес-консультантам продавать 30-страничные презентации за несколько миллионов. Нет? Вот первые картинки по запросам «консалтинг», «аналитика», «BI»:
Pie Charts, они везде
Практически ни одно рекламное изображение не обходится без круговых диаграмм (или их разновидностей). Это уже не столько инструмент, сколько символ.
И для реальной визуализации данных он плохо подходит.
Во-первых, область применения этой диаграммы очень узкая. Статичную структуру нужно показывать не так часто — маленькое количество кейсов. А во-вторых, многие люди плохо считывают доли в круговых диаграммах, особенно, если кто-то делает их объемными (сумасшествие). И в-третьих, такой же тип сравнения можно выразить другими диаграммами и будет только лучше.
Поэтому — лучше забыть о круговых диаграммах. Ну, если вы делаете рекламу или хотите добавить солидности вашей презентации, то вариант не такой уж и плохой.
Bar Chart (horizontal)
Она же — линейчатая диаграмма и служит для позиционного сравнения. Она наглядно показывает, какая из альтернатив лучше, кто какое место занимает и как они соотносятся по рангу.
Позиционное сравнение
Линейчатая диаграмма идеально подходит для рейтингов. И что очень удобно — в легенду легко помещаются длинные названия. В других видах графиков это может мешать.
Следующий тип — классика. Line Chart в русском часто называют просто «графиком».
Он используется для временного сравнения, когда нужно отобразить, как показатель менялся с течением времени, отличалась ли динамика для разных показателей и так далее.
Сравнение динамики показателей
На что обращать внимание при создании Line Chart:
- Адекватность временного периода. Иначе диаграмма превратится в нечитаемую кашу.
- Количество линий. Больше пяти-семи линий — табу, никто не будет в них разбираться.
Слева слишком большой временной период, справа — «лапша» из линий - Масштаб. Осторожнее, Line Chart любят те, кто собирается приврать с помощью данных [3].
Классика лжи — игры с масштабом
Следующий тип, Area Chart, служит для показа структуры в динамике. На что здесь нужно обращать внимание? Опять же — если делаем обилие слоев, то график становится нечитаемым. Убирайте лишние слои и оставляйте только самое важное (как это сделать, еще поговорим чуть дальше):
Гистограммы — это «универсальный молоток». У этого типа диаграмм множество вариаций, которые могут использоваться в самых разных ситуациях:
- временное сравнение;
- распределение частот;
- сравнение долей (привет круговым диаграммам);
- вклад в общую динамику;
- сравнение альтернатив и многое другое.
За эту универсальность гистограмма платит ограничением — на ней можно отобразить лишь небольшое количество периодов или сравнений. В противном случае график становится нечитаемым и перестает выполнять свою задачу.
Промежуточный итог: гистограммы, Area Chart и Line Chart могут закрыть 90% потребностей в визуализации данных. Достаточно изучить эти три инструмента и соблюдать те самые 4 шага, чтобы делать отличные диаграммы, которые помогут доносить ваши мысли до аудитории.
Scatter Chart
На десерт рассмотрим точечные диаграммы или «карту». Преимущество данного типа в том, что он вмещает в себя много показателей. В нем есть две оси, размер точки, цвет и символ — все это потенциально может отображать дополнительное измерение. Но чем больше запихать измерений, тем сложнее она будет читаться. В печатных документах, когда люди могут посидеть и разобраться, это допустимо, но при выступлении лучше использовать не более 2-3 измерений.
Доступные параметры: положение точки, цвет, размер и символ
Акценты и управление вниманием
Сформулированная идея и правильно выбранный тип диаграммы — половина успеха. Но кроме этого, мы хотим, чтобы читатель или зритель сразу смотрел в нужное место. Как расставить акценты?
Простейший способ, которым часто пренебрегают — стрелка. Дешево и сердито, но полностью выполняет свою задачу. Почти любой инструмент для создания скриншотов умеет ставить стрелку. С ней всегда можно обратить внимание зрителя на нужный элемент графика.
Другой вариант из «дешевых» — выделение рамкой. Его используют, когда рассказывают про какой-то временной период и хотят выделить динамику показателя.
Хорошим примером будет график из начала статьи, когда я говорил про игры с масштабом — можно рассказать как о маленьких изменениях, так и о картине в целом.
Разделители
По сути, линии-разделители — это вариация выделения рамкой. Они полезны, когда мы хотим выделить периоды «до/после» при показе динамики. Или, например, «коридор» интересных значений на точечной диаграмме.
Чуть больших усилий требует цветовое выделение. Зато оно выглядит «опрятнее».
Динамика показателей в конкретный период
Еще одна вариация цветового выделения — когда мы выделяем интересующие нас части графика более ярким оттенком:
Убираем лишнее
Последний шаг — убрать лишние элементы. Всё, что будет отвлекать и мешать донести основную мысль.
Вернемся к примеру с Area Chart. В этом типе убираем ненужные слои. Если нужно выделить, что доходы показывают прирост только по одной категории, то все прочие слои можно скрыть.
Схлопываем слои
Многие аналитические инструменты по умолчанию делают графики с линиями и шкалу. Вместо того, чтобы заставлять зрителя соотносить высоту столбцов и шкалу, мы можем указать цифры на каждом столбце отдельно и убрать ненужные уже линии. Будет выглядеть опрятнее.
Всегда сокращайте единицы измерения и округляйте до значимых цифр. Если речь о миллионах, то сотни и десятки точно не нужны. Во-первых, это будет меньше отвлекать зрителя, а во-вторых, будет проще уместить цифры на графике.
Ну и наконец, если вдруг получившийся график все еще не помогает вам донести мысль — то уберите его совсем. Зачем перегружать презентацию или отчет бесполезным балластом?
Источники
Пока что получилось кратко пройтись по самым базовым принципам, но тема визуализации данных намного шире. Если она заинтересовала, то рекомендую ознакомиться с источниками, без которых этой статьи не было бы:
[1] Александр Богачев, «Графики, которые убеждают всех». Книга еще в процессе, главы постепенно выкладываются автором на сайте, но то что есть, уже очень полезно.
[2] Джин Желязны, «Говори на языке диаграмм». Классик визуализации данных, который написал эту книгу тогда, когда графики еще рисовались от руки и надо было сразу думать, как сделать ее правильно.
[3] Даррел Хафф, «Как врать с помощью статистики». Не менее классический труд про манипуляцию данными.
- Блог компании Pixonic
- Визуализация данных
- Графический дизайн
- Аналитика мобильных приложений
- Презентации
Источник: habr.com