Визуальная аналитика

Данные могут быть проанализированы различными способами, и самый простой из них — создать иллюстративный материал или график и выявить в нем какие-либо закономерности — паттерн. Такой подход называется визуальной аналитикой и по своей природе является комплексным, так как сочетает анализ данных с их визуализацией и участием человека.

Сферы визуальной аналитики

Объем данных растет с угрожающей скоростью. В 1981 г. для объяснения того факта, что, чем больше знаний мы накапливаем, тем быстрее создаем новые, футуролог и изобретатель Бакминстер Фуллер предложил «кривую удвоения знаний». В течение всемирной истории вплоть до конца XIX в. объем знаний, которыми обладало человечество, удваивался примерно каждые 100 лет.

К концу Второй мировой войны удвоение общих знаний человечества стало происходить каждые 25 лет. В настоящее время период удвоения сократился до 13 месяцев, и компания IBM уже предсказала момент, когда наши знания будут удваиваться каждые 11ч.

Теперь мы располагаем огромным массивом данных! К сожалению, наша способность собирать и хранить эти данные растет быстрее, чем наша способность их анализировать. И хотя для автоматического анализа некоторых из этих знаний уже разработано много инструментов, сложность данных и задаваемые при их обработке вопросы означают, что нам, людям, по-прежнему приходится принимать участие самим в этом процессе и использовать свой творческий потенциал, гибкость и базовые знания о разбираемой конкретной ситуации.

Поэтому визуальная аналитика позволяет лицам, принимающим решения, объединить используемые при этом человеческие возможности с современными технологиями, имеющими огромные возможности по хранению и обработке данных, чтобы лучше разбираться в сложных проблемах, применяя для этого самые современные визуальные интерфейсы, которые помогают нам принимать более обоснованные решения.

Когда следует применять инструмент

Наиболее подходящим временем для использования визуальной аналитики является период, когда вы пытаетесь получить первое представление об огромном массиве данных и/или об уровне сложности проблемы, с которой вы столкнулись, и определить, можете ли вы получить помощь, если воспользуетесь дополнительными вычислительными мощностями.

Этапы визуальной аналитики

Из этого следует, что визуальная аналитика является полезным инструментом в том случае, когда вам нужно справиться с огромными, сложными и взаимосвязанными проблемами, где имеется много данных, которые нужно проанализировать. Понятно, что для такой аналитики необходимы соответствующие технологии, однако, вероятно, никакие технологии не заменят людей, потому что пока еще технологии не способны увидеть всю картину, относящуюся к решаемой проблеме, и определить после ее рассмотрения под разными углами, что именно нужно сделать. При использовании визуальной аналитики делается попытка взять лучшее и из человеческого интеллекта, и из технологий, чтобы объединить эти составляющие таким образом, который, с одной стороны, позволил бы технологиям выполнить большую часть тяжелой вычислительной работы, а с другой — заниматься решением именно тех проблем, с которыми необходимо справиться. При таком подходе конечный результат является приемлемым и полезным для человека, хотя его интерпретацией ему придется заниматься все равно самому.Таким образом, технология может усиливать когнитивные способности человека, добиваясь этого за счет привлечения большего количества когнитивных ресурсов, расширения рабочей памяти, сокращения времени поиска нужной информации и расширения возможностей, связанных с распознаванием закономерностей в больших объемах данных.

Использование визуальной аналитики путем преобразования данных в рисунки и графики помогает воссоздать более полную историю и выявлять паттерны и тенденции, скрытые в имеющихся данных, что в свою очередь может помочь при принятии решений на всех уровнях вашего бизнеса.

Вопросы, на которые можно получить ответ с помощью инструмента

По сути, визуальная аналитика может помочь выявить закономерности в данных и сделать доступным и понятным огромный массив данных любому человеку, независимо от того, является он ученым, специализирующимся на изучении таких данных, статистиком или обычным гражданином. Она может помочь вам ответить на следующие и им подобные вопросы.

  • Где находятся наши лучшие клиенты?
  • Каким является профиль наших лучших клиентов?
  • Увеличивается или уменьшается наша рыночная доля?
  • Есть ли какая-то связь между фактором X и фактором Y?

К тому же визуальная аналитика позволяет ответить на эти вопросы быстрее, чем при других подходах, и дать ответы в визуальном, т. е. в более наглядном виде.

Как следует пользоваться инструментом

Для начала нужно ввести и преобразовать данные. Часто источники данных существуют в разных форматах и находятся в разных местах, и поэтому сначала до применения методик визуального и автоматического анализа их необходимо интегрировать. Еще одной задачей, которую нужно решить, являются их обработка, упорядочение и группирование.

Преобразование данных

Следующий шаг — проведение автоматического анализа, в котором для создания моделей исходных данных часто используют методы интеллектуального анализа данных. После создания модели необходимо оценить и уточнить. Проводимые впоследствии визуализации позволяют вам взаимодействовать с устройствами для проведения автоматического анализа и варьировать данные, модифицируя для этого параметры и выбирая другие алгоритмы анализа. Затем модель визуализации может быть использована для оценки результатов созданных моделей. Для процесса визуальной аналитики характерно чередование визуальных и автоматических методов, благодаря чему происходят непрерывное уточнение и проверка предварительных выводов. Всегда помните, что польза визуальной аналитики достигается объединением возможностей людей и технологий. Поэтому если что-то кажется нам странным, то это можно проверить, уточнить или сделать еще один прогон и провести анализ заново.

В конечном счете для поиска очень важной информации необходимо именно взаимодействие пользователя с визуализированными данными, что происходит, например, при увеличении количества данных из различных областей или рассмотрении ситуации в различных визуальных перспективах. Самое главное, что с помощью визуализации, автоматического анализа, а также предыдущих взаимодействий, которые произошли при визуализациях и создании моделей с людьми, проводящими анализ, можно получить новые знания. К счастью, в настоящее время на рынке предлагается много доступных инструментов визуальной аналитики.

Практический пример

Шведский врач и ученый ХансРослинг — профессор в области международного здравоохранения и работает в Каролинском институте. Он также является статистиком, гуру по обработке данных и блестящим оратором. Если вы хотите увидеть мощь визуальной аналитики, я рекомендую вам посмотреть любое из его действительно интересных, забавных и привлекающих внимание выступлений на конференциях американского частного некоммерческого фонда TED (TechnologyEntertainmentDesign — Технологии, развлечения, дизайн).

В одном из них (http://www.ted.com/talks/hans_rosling_at_ state) он рассказывает о том, как его студенты часто обсуждают «их» и «нас» с точки зрения развитого мира, с одной стороны, и развивающихся стран — с другой. Для этого он попросил их точно определить, что именно они имели в виду, когда использовали эти ярлыки. Все студенты узнали о них в колледже и были уверены, что им в полной мере они понятны. Однако Рослинг настаивал на формулировке конкретного определения, и тогда один студент высказал предположение, что для развитого мира характерны «долгая продолжительность жизни и немногочисленные семьи», а для развивающегося — «короткая продолжительность жизни и многодетные семьи». Это определение было кратким и хорошо сформулированным, но было ли оно верным? Рослинг решил проверить эту гипотезу. Очевидно, что для того чтобы протестировать такую теорию, нужно было обработать огромное количество данных.

Ему потребовались показатели смертности и рождаемости для каждой страны, причем эти данные должны были быть за каждый год на протяжении нескольких десятилетий. Более того, если изучать эти данные «в сыром виде», т. е. представленные в виде электронных таблиц или баз данных, то получить необходимые ответы на интересующие вопросы вряд ли удастся: человеческий мозг просто не в состоянии обрабатывать такие огромные массивы данных и делать на их основе обоснованные выводы, но Рослингу это удалось — при помощи визуальной аналитики.

Он обнаружил, что понятие, которое сложилось у его студентов об особенностях жизни в различных частях мира, в значительной степени является искаженным. Рослинг создал визуальную карту, представляющую корреляцию между показателем «число детей на одну женщину» и показателем «продолжительность жизни» для стран по всему земному шару, а для демонстрации изменения этого соотношения из года в год воспользовался возможностями анимации. Наблюдая визуальную анимацию данных, зрители могли прийти к выводу, что в начальный период с 1950 г. определение студентов было в значительной степени точным, но к 2007 г. оно перестало соответствовать реалиям. Однако в аудитории были молодые студенты, которым это определение по-прежнему преподавали так, словно оно все еще было верным, соответствующим времени и точным.

Конечно, и в наши дни еще есть такие страны, как Афганистан, где это определение до сих пор остается истинным, но в подавляющем большинстве государств число членов в семье значительно сократилось, а люди там теперь живут гораздо дольше, чем их бабушки и дедушки.

Вот так себя проявляет мощь визуальной аналитики: она позволяет делать действительно полезными при ином подходе сбивающие с толку наборы данных и может помочь нам изменить наши прежние представления о том, что на самом деле происходит в нашем бизнесе.

О чем не нужно забывать

При использовании визуальной аналитики убедитесь, что ключевой стратегический вопрос, на который вы хотите получить ответ, четко сформулирован и указан на странице или на экране. Это поможет сосредоточить внимание читателя на предназначении данных и не запутаться в графическом или визуальном представлении материала.

Главной опасностью при применении визуальной аналитики является вариант, при котором вы все внимание станете уделять визуальной части решаемой задачи и начнете самыми разными способами обрабатывать и представлять данные, стараясь показать их с самых разных сторон. Визуальная аналитика является чрезвычайно полезным инструментом для преодоления разрыва, имеющегося между данными и их пониманием, но этот разрыв можно закрыть только тогда, когда вы занимаетесь только тем, что вам необходимо, и только тогда, когда это вам необходимо. Из того, что программа визуальной аналитики может представлять данные и манипулировать ими тысячами возможных способов, конечно, не следует, что вам все эти варианты нужны в полном объеме. Сосредоточьтесь на получении только тех ответов, которые вам необходимы.

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (3 оценок, среднее: 5,00 из 5)
Загрузка...