Анализ посещаемости блога Power BI Russia от команды Mello

477

Привет! Это команда melloАнтон Астахов и Иван Иванов. Мы откликнулись на предложение коллег из myBI поучаствовать в серии статей о моделировании данных в Power BI на примере Google Analytics. Первая статья была посвящена модели данных “Звезда”, вторая — построению такой модели для Google Analytics. Немного поработав над этой моделью данных, мы сформировали отчет, о котором и хотели бы рассказать в этой статье.

В файл, который нам предложили коллеги, уже были загружены данные о посещаемости блога Power BI Russia. Мы решили создать отчет, который позволил бы получить информацию о динамике трафика, а также показать эффективность отдельных публикаций.

По сравнению с аналитикой интернет-магазинов, сайтов услуг и сервисов, возможности для анализа конкретных проектов гораздо меньше. Например, для интернет-магазина можно настроить модуль электронной торговли, объединить его с издержками, тем самым получить качественный анализ таких финансовых показателей, как ROI, ДРР, CPO и т.д. Для сайтов услуг есть возможность настроить call tracking и отслеживание лидов с сайта, таким образом можно оценивать поведение потенциальных покупателей. Для оценки сервисов возможности еще шире (особенно если используется модель подписки).

Почему же для функционал аналитики контентных проектов меньше?

Во-первых, по ним зачастую можно анализировать только простые метрики (особенно, если нет подписки на email рассылку). То есть, отсутствует возможность связать финансовые результаты с эффективностью контента.

Во-вторых, из-за особенностей расчета отказов и длительности сеанса эти показатели для контентных проектов могут быть некорректными.

Однако, если нам известно, какие показатели сайта влияют на финансовые или прочие KPI контентного проекта, ситуация радикально меняется — в этом случае мы можем строить гипотезы о влиянии на эти показатели. В этом нам поможет Google Analytics, он  позволяет получать практические любые метрики по работе и использованию сайта, анализировать их изменение и проверять наши гипотезы. Мы не будем подробно рассматривать этап настройки GA, а перейдем к следующему этапу — визуализации данных, собранных счетчиком аналитики в Power BI.

Наш отчет выглядит следующим образом:

Пройдемся по визуализациям в отчете по мере их информативности и начнем с наименее “интересных”, оставив самое, на наш взгляд, “вкусное” напоследок. Итак, первая визуализация — динамика просмотров страниц по дням.

Динамику по посещаемости блога обычно представляют в виде графика с отображением количества просмотров страниц или страниц входа за определенный период, однако мы решили акцентировать внимание на динамике трафика к предшествующему дню, чтобы проанализировать пики роста трафика, а также проследить за его динамикой:

Благодаря визуализации появилась возможность оценить, насколько существенно увеличивается трафик в дни публикаций материалов в социальных сетях, а также при выходе email рассылок.

Следующая визуализация демонстрирует распределение трафика по дням недели:

Здесь все логично: к концу недели трафик падает и его минимальное значение приходится на воскресенье. На первый взгляд это достаточно простой и очевидный отчет, однако, до начала работы с ним, мы не владели полной информацией о периодах email рассылок и графике публикаций в социальных сетях. Простая сегментация трафика показала следующий результат:

Понедельник и пятница генерируют наибольшее количество трафика, как выяснилось, в эти дни осуществлялся выход публикаций в социальных сетях, а email рассылки выходили в понедельник:

Следующим шагом было структурирование полученных данных и их градация по принципу  “ABC анализа” на основе значения “просмотры страницы”:

В результате мы получили возможность анализировать не только отдельные страницы, но и целые группы:

  • группа А — 70% трафика;
  • группа B — 20% трафика;
  • группа C — 10% трафика.

Как правило, интересно и полезно анализировать тот контент, через который проходит основной поток трафика (категория А), ведь именно по нему пользователи формируют мнение о вашем ресурсе.

Наверняка, вы заметили в таблице столбец с именем “Коэф. участия”. Пожалуй, это самое интересное, что мы реализовали в отчете.

Этот коэффициент рассчитывается как отношение количества входов к числу просмотров страницы, при этом вход — это когда страница “привела” трафик на сайт, например, она стала первой при переходе из поисковой системы или социальной сети. Просмотр страницы — это любой просмотр, в т. ч. и в том случае, когда страница является страницей входа.

Немного подумав над моделью данных, мы решили ввести коэффициент участия в отчет для того, чтобы оценить, насколько каждая страница эффективна в плане привлечения трафика и одновременно интересна посетителям сайта. При интерпретации коэффициента важно знать, что, если он равен или близок к 1 или 0, по нему нельзя сказать однозначно, хороша страница или очень плоха.

Если значение близко к единице, это говорит о том, что количество входов равно количеству просмотров, т.е. страница работает только на генерацию трафика, при этом ее крайне мало просматривают при внутренних переходах по сайту и наоборот. Если коэффициент ближе к нулю, значит страница больше работает в цепочке внутренних переходов, но не генерирует существенного трафика.

Поскольку сам отчет по значению коэффициента был не очень “интересным”, мы решили сравнить его со средним значением глубины прокрутки страницы. В результате мы получили:

Подавляющее большинство страниц лежит в правой верхней части графика, это говорит о том, что в основном страницы блога работают на привлечение трафика, вместе с тем они имеют значение прокрутки от 60 до 70 процентов, что указывает на интерес пользователей (на сайте большой “подвал”, есть блок с комментариями).

Выбор страниц группы или класса А показал, что все они имеют глубину прокрутки и коэффициент участия выше 50 процентов, это свидетельствует о том, что их просматривают достаточно полно и при этом они работают (в основном) на привлечение трафика (т.е. больше как страницы входа), однако тот факт, что основная масса этих страниц находится в пределах 60-70% по коэффициенту “участия” указывает, что они также интересны и в плане просмотра при навигации по сайту.

Таким образом, получив ограниченный (но качественно сформированный) набор данных, мы смогли проанализировать эффективность блога, выдвинуть несколько гипотез, которые впоследствии подтвердились при общении с коллегами.

Данный отчет Вы можете использовать в качестве первого шага для изучения вашего контентного ресурса. В результате Вы получите новые показатели, графики, отчеты для аналитики. Поэтому желаем вам удачи в этом сложном и захватывающем путешествии по вашим данным 🙂

Примечание от команды блога Power BI Russia. Во-первых мы хотим поблагодарить Антона и Ивана за потраченное время и предоставленный результат. Во-вторых, хотим предложить читателям самостоятельно изучить файл с отчетом, которые разработали коллеги. Если у вас появится желание поэксперементировать с данными Google Analytics, собранными в Звезду, и создать свой вариант аналитического отчета — мы будем рады разместить его вместе с описанием в следующих статьях.

Оставить комметарий