Книг по R на русском языке становится все больше, что не может не радовать. Совсем недавно издательством «Манн, Иванов и Фербер» была опубликована работа Нейтана Яу (Nathan Yau) «Искусство визуализации в бизнесе. Как представить сложную информацию простыми образами» (оригинальное название книги «Visualize This: The FlowingData Guide to Design, Visualization, and Statistics»).
Нейтан является автором FlowingData — одного из наиболее популярных англоязычных блогов, посвященных визуализации данных. В своей новой книге Нейтан делится приемами создания инфографики, которая позволяет раскрыть порой неочевидные свойства анализируемых данных и рассказать на их основе интересную историю. Следует оговориться, что R — не единственный инструмент для обработки и визуализации данных, обсуждаемый в книге. Наряду с описанием выполнения определенных задач при помощи R, приводится много примеров кода Python, а также рассматриваются Javascript (JSON), XML, Adobe Illustrator, др.
+100500 КНИГ — Искусство визуализации в бизнесе
Глава 1. Как рассказать историю с помощью данных
Будучи вещью объективной, данные имеют человеческое измерение. Это значит, что за грудой цифр и слов часто скрываются истории о реальном мире, и задача статистики и визуализации состоит в том, чтобы помочь эти истории рассказать. На что обращать внимание в данных при подготовке таких историй? Как выбрать подходящее средство визуализации?
Каковы обязательные элементы статистической диаграммы? Как учесть аудиторию, которой предназначен конечный результат визуализации? Эти вопросы обсуждаются в первой главе книги.
Глава 2. Как обращаться с данными
Прежде чем приступить к визуализации данных, их необходимо сначала получить. Более того, данные очень редко поступают в готовом к работе виде, и поэтому обычно значительную часто всего процесса визуализации занимает приведение данных к необходимому формату и их очистка.
Во второй главе книги описываются открытые источники данных и программные средства их получения и подготовки к анализу. В частности, подробно обсуждается пример скрипта на языке Python, с помощью которого извлекаются исторические ряды наблюдений с одного из сайтов, посвященных прогнозу погоды. Далее читатель знакомится с распространенными форматами хранения (текст с разделителями, JSON, XML) и инструментами форматирования данных (Google Refine (сейчас проект называется OpenRefine), Mr. Data Converter, Mr. People, Python).
Глава 3. Выбор инструментов для визуализации данных
Существует огромное разнообразие программ, позволяющих визуализировать данных. В этой главе обсуждается программное обеспечение, на которое стоит обратить особое внимание, включая R, Python, Flash и ActionScript, Tableau Software, Many Eyes, Google Maps, Modest Maps, Polymaps, HTML, CSS, Adobe Illustrator, Inkscape, и др.
Глава 4. Визуализация паттернов во времени
Как следует из ее названия, эта глава посвящена обсуждению вопросов, связанных с визуализацией временных рядов. Приводятся пошаговые примеры создания заготовок диаграмм в R и их последующего доведения до конечного результата в Adobe Illustrator.
Глава 5. Визуализация пропорций
Как соотносится группа людей, сделавшая тот или иной выбор, с остальными? Как распределяются калории между жирами, белками и углеводами — поровну, или одна из этих групп доминирует? В пятой главе обсуждаются приемы визуализации пропорций, которые помогут ответить на подобные вопросы. Приводится подробный пример создания круговой диаграммы при помощи замечательного инструмента — Protovis (JavaScript-библиотека, позволяющая использовать возможности современных браузеров для работы с масштабируемой векторной графикой (Scalable Vector Graphics, SVG)). Кроме того, приведен подробный пример создания диаграммы типа «treemap» при помощи R и функции map.market() из пакета portfolio .
Глава 6. Визуализация зависимостей
Данная глава посвящена приемам визуализации корреляционных связей между количественными переменными. Обсуждаются такие типы статистических графиков, как диаграммы рассеяния и матрицы диаграмм рассеяния, диаграммы рассеяния в сочетании с линиями тренда, пузырьковые диаграммы, матрицы гистограмм. Для создания всех этих типов диаграмм используется R.
Глава 7. Выявление различий
Эта глава посвящена тому, как обособлять группы в рамках совокупности на основе большого числа критериев. Рассматриваются такие типы графиков, как тепловые карты, лица Чернова, лепестковые диаграммы и диаграммы параллельных координат. Все примеры построены на коде R.
Глава 8. Визуализация пространственных отношений
Нейтан Яу известен как автор многих красивых карт, отражающих пространственное распределение и динамику разных явлений. В восьмой главе своей книги Нейтан описывает основы создания инфографики этого типа средствами Python, R и ActionScript.
Глава 9. Прицельный дизайн
Дизайн графиков определяет то, насколько легко будет их понять и интерпретировать заложенную в них историю. В этой заключительной главе книги описываются приемы, которые помогут сделать визуализацию данных максимально понятной и информативной.
Книга понравилась мне своей логичностью в изложении материала — автор начинает с обсуждения того, зачем мы вообще пытаемся визуализировать данные, после чего переходит к способам получения и подготовки данных к работе, и далее — к рассмотрению основных приемов визуализации. Все главы содержат большое количество примеров с использованием разнообразных программ, что дает хороший обзор доступных инструментов и делает книгу полезным сборником практических советов и готовых рецептов. Кроме того, Нейтан постоянно подчеркивает необходимость овладения несколькими программными средствами анализа и визуализации данных. Нельзя не согласиться с ним, что навыки работы с несколькими такими инструментами помогают экономить время и делают нас свободнее в выборе средств и способов достижения задуманного.
Правда, как мне кажется, у книги есть и один небольшой недостаток, который связан, как ни странно, именно с попыткой автора дать обзор многих программных инструментов одновременно. Для успешного освоения излагаемого таким образом материала читатель должен будет уже иметь определенные навыки работы с обсуждаемыми инструментами, иначе он может легко потеряться в строках кода R, Python, ActionScript и др. Соответственно, эта книга вряд ли может стать вводной для тех, кто не знаком ни с одним языком программирования и только приступает к знакомству с областью визуализации данных. С другой стороны, тем, кто уже имеет опыт работы в этой области, при чтении некоторых частей книги может стать скучно от констатации очевидного.
Есть также мелкие нарекания к переводу с английского. Например, встречаются такие неудачные фразы, как «генерализация примера» (стр. 54) вместо «обобщения примера», «маппинг» (от «mapping») вместо «картирования» (с. 95), «диаграмма-радар» вместо достаточно общепринятого термина «лепестковая диаграмма» (с. 249), и т.п.
Тем не менее, несмотря не некоторые мелкие недочеты (а какая работа их лишена?!), книгу «Искусство визуализации в бизнесе» однозначно можно порекомендовать тем читателям, кто интересуется анализом и визуализацией данных и хочет больше узнать о соответствующем программном обеспечении.
Источник: r-analytics.blogspot.com
Обзор книги «Искусство визуализации в бизнесе. Как представить сложную информацию простыми образами»
Выражение «коротко о главном» к этой книге точно не относится. Но оно и к лучшему! Ведь у Нейтана Яу получилось целое пособие о том, как работать с данными и представлять их в понятном и приятном для аудитории виде.
Один из лучших способов исследовать крупную базу данных и попытаться разобраться в ней — это визуализация. Поместите числа в видимое пространство и предоставьте мозгу — своему или ваших читателей — выявить паттерны. В этом деле мы все мастера. Вы сможете разглядеть истории, которые, возможно, никогда бы не увидели, применяя лишь формальные статистические методы.
Скажу прямо, эта книга не из тех, что читаются на одном дыхании (по крайней мере, для меня). Конечно, ее можно прочитать быстро, ведь картинок в ней куда больше, чем текста. Но все-таки лучше превратить ее в настольный справочник и обращаться к нужному разделу в нужный момент.
Кому эта информация может быть полезна? Стартаперам, маркетологам, дизайнерам, журналистам, да и вообще всем трудящимся, имеющим дело с публичными выступлениями, подготовкой презентаций и визуализацией данных.
Всех людей, далеких от программирования, предупреждаю: автор убежден, что «небольшое знание программирования убирает всякие рамки», из-за чего в книге встречаются куски кодов на 1-2 страницы. Конечно, Нейтан подробно объясняет, где, как и в каких случаях их применять, но все-таки нужно быть морально готовым к тому, что эта история не только про Adobe Illustrator. Хотя, между прочим, приличная часть разобранных примеров может быть выполнена и в иллюстраторе с теми же временными затратами.
Какие темы разбирает автор?
- Сбор и форматирование данных;
- Инструменты и готовые решения для визуализации (программирование, иллюстрирование, маппинг);
- Визуализация паттернов во времени;
- Визуализация пропорций;
- Визуализация зависимостей;
- Визуализация пространственных отношений.
Подводя итог: я бы рекомендовала использовать данную книгу в качестве некого справочника. Можно даже не читать ее целиком, а просто прибегать к отдельным разделам по необходимости, сразу же применяя полученные знания на практике.
Источник: vc.ru
«Искусство визуализации в бизнесе»: Нейтан Яу 1
Совсем недавно в горячо любимом нами издательстве «Манн, Иванов и Фербер» вышла книга «Визуализации в бизнесе» Нейтана Яу (Nathan Yau). Нейтан — ведущий блога flowingdata.com, статистик по образованию и один из самых известных людей в мире современной инфографики. Поэтому мы с особым интересом отнеслись к его книге.

Итак, у нас в руках увесистые 340 полноцветных страниц книги, в оригинале называющейся Visualize this! Открываем на произвольной странице, и… начинаем смущаться. Простые столбиковые графики, коды программирования, и отсутствие ярких иллюстраций к которым привык интернет… Та ли эта книжка?
Начинаем вчитываться, и всё встаёт на свои места. Нейтан с первых страниц книги делится своим собственным опытом в визуализации больших массивов статистических данных. Вся его карьера — это донесение смысла исходных данных через графику. Ключевая сложность его работы — большие объемы, из которых необходимо вычленять закономерности, и для этих задач вся книга построена на примерах применения языка программирования R (эр).
Дизайнер начинает недоумённо смотреть и думать, зачем ему это нужно? Оказывается, для того чтобы нарисовать инфографику, необходимо сначала найти и подготовить к визуализации данные. Дизайнеру дали несколько скучных цифр и попросили сделать «wow»? — книга даёт ему ответ, что делать в этом случае: откладывать в сторону планшет и начинать работать с первичными источниками данных.
Менеджер начинает смущаться, стоит ли ему тратить столько времени на программирование кодов визуализации, чтобы получить простой график, нарисованной в книге? Вполне обоснованно, казалось бы — если его основная работа состоит в создани презентаций в MS PowerPoint. Но если ему попадётся большой набор цифр, который тяжело проворачивается в MS Excel — то сразу становится понятно, что без этой книги не обойтись. Вспомните про тренды Big Data, и вы поймёте что я не шучу.
Так кому же нужна эта книга? Прежде всего книга будет интересна тем, чья работа — это одновременно и аналитика объемов данных, и представление информации. Таких появляется всё больше и больше. Эта междисциплинарность (аналитика, дизайн и программирование вместе взятые) создаёт того самого менеджера будущего, который в отличие от «маленькой шестерёнки в большой компании» прошлых лет, становится универсальным супер-менеджером компании 21го века.
Как читать эту книгу? С карандашом в руках. Но не для того, чтобы делать пометки на страницах, хотя в книге много полезного. А прежде всего для того, чтобы пошагово проходить с автором примеры.
Они кажутся очень простыми (например, какой-нибудь «простой» линейный график) — но чтобы его получить, необходимо проделать ряд подчас нетривиальных логических действий, которые приведут к такому графику. Поэтому чтобы придумать визуализацию — нужно прежде всего нарисовать лучшую карандашом визуализацию на бумаге, а не выбирать из списка «диаграммы» в Excel.
Браво Нейтан, глава «Оформление» идёт последней! Наше агентство Infographer придерживается того же принципа, вторичности оформления по отношению к данным и аналитике. В этой главе есть над чем поразмышлять — несмотря на отсутствие готовых рецептов, она показывает насколько важно оформление для создания общего тона и четкости коммуникации.
Резюме: пусть вас не смущает не очень удачное название книги. Визуализации, создаваемые при помощи этой книги, применимы везде, и даже гораздо больше в журналистике данных, чем в бизнес-аналитике. Но вспомнив оригинальное название «Визуализируй это!», вы поймёте что перед визуализацией стоит очень мощный этап — решить, что именно вам надо визуализировать и зачем.
Отрывки из книги:
- Оглавление 102 КБ, PDF
- Введение 8.7 МБ, PDF
- Глава 1. Как рассказать историю с помощью данных 17 МБ, PDF
- Глава 2. Как обращаться с данными 14.1 МБ, PDF
Источник: infographer.ru
