В аналитике нуждается каждая компания, чтобы оставаться конкурентоспособной в современном мире, в котором имеется множество данных. Каждый менеджер должен понимать хотя бы основы аналитики и знать, когда и где ее следует применять. Именно об этом и рассказывается в этой книге. В ней приводится подробная «дорожная карта» для движения по основным областям, где руководители компаний могут прибегнуть к аналитике, а также дается обзор ключевых методов аналитики. Книга поможет вам разобраться в сущности наиболее важных методов аналитики, а также в том, как можно получить данные, необходимые для аналитики.
В настоящее время нет такого журнала по вопросам лидерства или управления, в котором бы ничего не говорилось о взрывообразном появлении «больших массивов данных», «аналитике», «сборе, обработке и анализе деловой информации», «управлении знаниями», «интеллектуальном анализе данных», «обнаружении данных» или «содействии принятию решений».
Эти термины нередко используются как синонимы и взаимозаменяемые понятия, из-за чего возникает большая путаница. Цель данной книги — разобраться в этой путанице и помочь вам понять суть аналитики, чтобы вас не отвлекали и не вводили в заблуждение разные модные словечки, возникающий вокруг них ажиотаж, а также разобраться в том, почему эта составляющая современного бизнеса является столь важной. И что, возможно, самое главное, вы познакомитесь здесь с различными ключевыми аналитическими инструментами, которые есть в вашем распоряжении, и узнаете, когда и для чего ими можно воспользоваться.
Область аналитики в наши дни вызывает огромный интерес, что совершенно понятно: она обещает познакомить нас с коммерчески выгодными идеями, которые потенциально могут быть использованы для поиска новых рынков, новых нишевых аудиторий на уже имеющихся рынках и областей, перспективных для будущих исследований и разработок. В значительной степени этому способствуют ставшие широко известными истории и примеры из бизнеса, связанные с такими мощными источниками данных, как Target, Walmart, Amazon, Facebook , при изучении которых у обычных бизнес-лидеров нередко возникает чувство беспомощности и растерянности: люди просто не знают, с чего начать и что надо делать, чтобы догнать конкурентов. Конечно, большинство компаний не сможет достичь таких же высот даже с помощью аналитики, но это вовсе не значит, что аналитика предназначена только для самых крупных участников бизнеса.
Нет большего заблуждения. Аналитика может улучшить результаты деятельности любой компании, независимо от ее размера, но для того чтобы это случилось, нужно сначала разобраться в аналитике и рассеять туман, который ее окружает, и здесь вам на помощь придет эта книга.
По сути, аналитика — это изучение данных и того, как мы можем использовать их для улучшения показателей своей деятельности в бизнесе и достижения большего успеха. Понятно, что эта концепция не нова, бизнес-лидеры и руководители высшего звена на протяжении десятилетий пользовались данными о ситуации на рынке, что помогало им принимать стратегические решения и менять курс, если в этом возникала необходимость. Но в нынешнем понимании этого подхода есть одна новая особенность: понятие «данные» трактуется сейчас все более широко, а благодаря современным технологическим решениям появляются такие возможности хранения данных, их анализа и извлечения из них необходимой информации, о которых в прошлом даже не мечтали.
Данные — это сырье
Сырьем для процесса извлечения полезной информации являются данные, трактуемые как в привычном, традиционном смысле, так и в нынешнем как большие массивы данных. В настоящее время термин «большие массивы данных» используется для описания всего того, что мы делаем, говорим, пишем, посещаем или покупаем, если при этом оставляем цифровой след. Он же относится и к нашим планам все это сделать в будущем, когда мы также воспользуемся образующимся огромным количеством данных, чтобы с их помощью предложить новые идеи и улучшить результаты. Хотя термин «большие массивы данных», скорее всего, исчезнет, потому что «большие массивы данных» становятся обычными данными в прежнем их понимании, в настоящее время прилагательное «большой» будет пока применяться, что объясняется четырьмя особенностями, или четырьмя V.
- Объем. Этот параметр относится к огромному количеству данных, которые создаются каждую секунду, что не в последнюю очередь происходит из-за нашей любви к умным технологиям и постоянной связи людей друг с другом.
- Скорость. В данном случае речь идет о быстроте появления новых данных и их распространении по всему миру. Например, при выявлении случаев мошенничества необходимо проверить миллионы транзакций по кредитным картам, чтобы выявить необычные закономерности, и делать это практически в режиме реального времени.
- Разнообразие. Под этим словом понимается появление различных видов данных, которые поступают из самых разных источников, от финансовых документов до каналов социальных медийных средств, от фотографий до сенсорных устройств, от видеозаписей до голосовых записей.
- Достоверность. Включение этого параметра объясняется разной степенью истинности генерируемых данных. Чтобы понять это, достаточно вспомнить о сообщениях в Twitter с их хештегами, аббревиатурами, опечатками, особенностями языка текста и включением элементов разговорной речи.
Фактически вместо четырех V можно говорить о пяти, если добавить в приведенный выше набор пятую составляющую — ценность (Value). Можно утверждать, что аналитика необходима для достижения именно ее, т. е. данные используются для получения ценности. Для этого с помощью аналитики необходимо получить ответы на четыре ключевых вопроса.
- Что произошло?
- Почему это произошло?
- Что сейчас происходит?
- Что может произойти в будущем?
Понятно, что эти вопросы важны, и поэтому на них нужно знать ответы. Получить их можно с помощью аналитики. Чаще всего под бизнес-аналитикой понимают процесс, благодаря которому можно преобразовать получаемое сырье (данные) в коммерчески значимые идеи (результаты аналитики), которые затем можно использовать для информирования руководства, улучшения показателей деятельности компании и основополагающей стратегии. (В совокупности это называется сбором, обработкой и анализом деловой информации.)
Конечно, достоверность и точность этого процесса зависят от того, насколько хорошо вы понимаете сущность тех ключевых стратегических вопросов, на которые хотите получить ответы, и от качества данных, которые вы используете для получения этих ответов. Поэтому, прежде чем мы займемся более подробным изучением разных ключевых аналитических инструментов, давайте сначала сделаем шаг назад и получим полное представление о видах и форматах данных, которые теперь можно проанализировать.
Виды и форматы данных
Говоря о данных, нужно прежде всего разобраться в их основных различиях. Данные могут быть структурированными, частично структурированными и неструктурированными и поступать либо из самой компании, либо из внешних источников.
Под структурированными данными понимаются данные, которые хорошо организованы и расположены в конкретной записи или файле в выделенных для них полях. К этой категории относятся данные, содержащиеся в реляционных базах данных или электронных таблицах. Структурированные данные легко вводить, хранить и анализировать, потому что работа с ними осуществляется в соответствии с установленными правилами и часто выполняется с помощью языка структурированных запросов (StructuredQueryLanguage — SQL). Несмотря на то что SQL представляет собой огромный шаг вперед по сравнению с хранением и анализом данных на бумажной основе, далеко не вся информация, используемая в бизнесе, хорошо подходит для ее размещения в заранее выделенных местах, и тогда приходится иметь дело с частично структурированными и неструктурированными данными.
По оценкам, 80% значимой для бизнеса информации связано с неструктурированными или частично структурированными данными. Фактически под ними понимаются все данные, которые нельзя легко вставить в поля, строки или столбцы. Часто текст является тяжелым для обработки, но при этом он может содержать даты, цифры и различные типы данных, такие как изображения или аудиофайлы. Частично структурированные данные представляют собой гибрид неструктурированных и структурированных данных. Эти данные могут иметь некоторую структуру, которая используется для анализа, но значительные их части являются неструктурированными. Например, пост в Linkedln можно классифицировать по его автору, дате размещения или размеру, однако его содержание, как правило, является неструктурированным. То же самое нередко характерно и для программного обеспечения, используемого для обработки текстов, которые включают метаданные, а именно имя автора, дату создания и изменения, но содержание этого документа остается неструктурированным. Конечно, важное значение имеет и источник данных; в настоящее время большинство бизнесменов обладают огромным количеством данных. Но у них есть одна значительная проблема; у них мало идей, и они часто не знают, как использовать имеющиеся у них данные, не говоря уже о богатстве внешних данных, которым они также могли бы воспользоваться. Как правило, к внутренним данным доступ является более простым и дешевым, потому что бизнесмены ими сами владеют и сами их контролируют. К числу таких данных относятся финансовые отчеты, отзывы клиентов, история транзакций, опросы сотрудников, данные отделов кадров и др.
Внешние данные, как можно судить по их названию, — это данные, которые существуют за пределами вашей компании и являются общественным достоянием либо принадлежат какой-то другой организации. Если данные являются общественным достоянием, вы можете получить их обычно бесплатно или заплатить за них третьей стороне, чтобы она их собрала для вас. За получение частных данных, которые вам нужны, как правило, требуется заплатить либо владельцу другой компании, либо поставщику данных, выступающему третьей стороной. К внешним могут относиться данные о погоде, данные о профиле социальных средств массовой информации, данные о трендах или данные властных структур, такие, например, как информация о переписи.
Данные | Внутренние | Внешние |
Структурированные | Кассовый терминал Финансовые данные Данные о клиентах Учетные документы отдела кадров | Маркетинговые исследования Данные позиционирования, полученные с помощью системы глобального позиционирования (GPS) Сенсорные данные Данные погоде |
Частично структурированные | Фотографии или графические документы с метками или указателями категорий Видеоматериалы с метками или указателями категорий Электронные письма | Маркированные фотографии Организованные определенным образом графические материалы Маркированные видеоматериалы Категоризированные тексты |
Неструктурированные | Сайты Текстовые файлы Фотографии Аудиозаписи Социальные медийные средства | Сайты Текстовые файлы Фотографии Аудиозаписи Социальные медийные средства |
Именно взрывообразное увеличение количества частично структурированных и неструктурированных данных, которое сопровождается улучшением технологических возможностей по хранению и анализу этих данных, делает аналитику в настоящее время очень увлекательным занятием. Теперь мы имеем возможность анализировать различные форматы, в том числе:
- изображения;
- тексты;
- числовые данные;
- видеоматериалы;
- аудиоматериалы;
- сенсорные данные.