Пальцем в небо. Почему данные ОТТ-провайдеров не дают представления о рейтингах телеканалов
Рейтинговое голосование на моей страничке в Фейсбуке определило лидера, поэтому поделюсь размышлениями с теми, кто, возможно, также думает и колеблется – стоит или не стоит использовать данные ОТТ-провайдеров. А если использовать – то как именно.
Буду стараться не повторять того, что было в статье ранее. На то, чтобы поделиться размышлениями (и в целом копать под ОТТ), меня вдохновил Николай Андрущенко.
Что такое данные, которые можно получить от ОТТ-провайдеров? Очень важно понять, что это не измерения. Но что тогда? Сбор статистической информации о пользователях услуги провайдера. Что такое пользователь услуги – это всегда телевизор (в широком понимании – экран, принимающий и показывающий картинку от ОТТ-провайдера). Что это означает? Что наши данные – не всегда данные о телевизорах, и никогда – о людях. То есть мы можем лишь предполагать, кто в это время смотрит телевизор, но никогда не можем знать это наверняка. И при таком переходе от телевизоров к людям теряются все преимущества статистической природы данных ОТТ. Вывод прост: данные от ОТТ-провайдеров надежны лишь в части информации о телевизорах.
Как можно использовать такие данные?
Предположим, что в Украине – около 250 тыс. пользователей услуги ОТТ. Собрав данные всех провайдеров, мы получим лишь статистические данные о смотрении именно этих 250 тысяч. И эти данные нельзя экстраполировать на все остальных типы приема в Украине – они не дают представления о рейтингах телеканалов, их охвате и т.п. Другими словами, в этих данных нет генеральной совокупности – они не распространяются ни на кого, кроме аудитории, с которой собирались. Более того, такие данные даже не будут в полной мере отображать реальное потребление пользователей ОТТ, поскольку у определенного процента аудитории есть и другие виды приема сигнала (Т2, спутник, простой кабель часто идут в комплекте и бесплатно). Поэтому даже статистика использования ОТТ – это всего лишь статистика использования ОТТ с разбивкой на то, что именно выбирают к просмотру.
Что со всем этим можно делать?
Самый важный абзац. Данные, которые вам дает ОТТ, мало что значат для дальнейшего использования: без дополнительного анализа и глубокого понимания, что это за данные и как они получены, без возможности создавать поведенческие целевые, без понимания динамики смотрения по созданным группам такие данные абсолютно бесполезны для кого угодно, кроме того или иного ОТТ-провайдера. Понимая поведение тех или иных групп зрителей, ОТТ-провайдер может формировать пакеты из тех или иных каналов.
Какие страхи связаны с этим?
В отличие от данных пиплметрических измерений (тех, что проводятся индустриально с использованием пиплметров), данные, полученные от ОТТ-провайдеров напрямую или через посредников из агрегаций, нельзя реально проконтролировать. Из-за отсутствия контроля всегда будет соблазн включить определенные группы запросов в финальные данные, а другие – не включить, чтобы получить желаемое искривление данных в ту или иную сторону. Соответственно, столь малонадежные данные валютой быть не могут. Кроме того, даже при условии чрезвычайного контроля за обработкой данных от ОТТ-провайдеров у каналов может возникать соблазн напрямую пользоваться влиянием на показатели, чтобы выглядеть привлекательнее в глазах рекламодателей, с ними работающих. Как именно? Например, понимая, какие провайдеры предоставляют данные ОТТ-агрегатору, кое-кто может просто подключить необходимое количество семей к тому или иному провайдеру, оплатить им услуги и попросить смотреть свой канал. Сколько таких семей нужно? При панели из 250 тыс. семей 60-70 таких подключений смогут сделать небольшой канал лидером в том или ином сегменте. Потому и для рекламодателей использование таких данных довольно рискованно с точки зрения эффективности размещения рекламы. А вот для рекламодателей, продающих платный контент, оборудование для ОТТ и т.п., использование таких данных может быть полезно. Но тут вопрос легальности такого использования. Зная, сколько зрителей в реальном времени находится на том или ином канале, можно показывать им рекламу поверх контента. Вот, собственно, и все.
Исторически сложилось так, что использование рейтингов часто связывают именно с рекламой. Хотя на самом деле телевизионные измерения – это намного больше (если говорить о них как измерениях, а не сборе статистических данных о поведении зрителей ОТТ). Нужно помнить, что исследования выборочны, и понимать, как правильно экстраполировать цифры, полученные в выборочном опросе, на данные генеральной совокупности. Почему это важно? Потому что рекламируемые товары и услуги продаются не панелистам, а потребителям, которых намного больше. Соответственно, нужно уметь переносить все эти GRP и охваты на реальных потребителей.
Рассмотрим на примере новостных телеканалов один из вариантов реально ожидаемого показателя в генеральной совокупности. Это самый простой пример. В реальности такие расчеты можно проводить каждый день. Основной параметр, который предлагаю контролировать, это наличие в данных такой единицы как «аутлаеры». То есть это зрители, смотрение которых не похоже на смотрение остальных. Одним из простейших индикаторов будет отклонение от распределения часового смотрения.
Для начала рассмотрим таблицу данных новостных телеканалов за период с 1 по 23 апреля (аудитория 18+).
Так выглядят обычные цифры, на первый взгляд. Доля – очень привычный показатель, останавливаться на нем не будем. Дальше идет возраст – видим, что по этому показателю новостные каналы отличаются. NewsOne – особенно «пожилой», даже на фоне других новостных каналов: средний возраст его зрителя – 65 лет. Средний возраст – очень важный показатель в оценке доли. Почему? Казалось бы, каналы позиционируются на одну аудиторию – 18+, но это и люди от 30 до 40 лет, и те, кому 75. И в таком широком спектре не все однородно.
Далее в таблице – среднее время просмотра канала. Наибольше – у «112», довольно близко – NewsOne, но такое соседство рождает вопрос, как это получается, ведь между каналами огромная разница в объемах непрограммного времени.
На первом шаге посмотрим, кто формирует цифры – то есть какая связь существует между временем смотрения и вкладом той или иной группы в показатели канала. На графике видно распределение зрителей информационных каналов на группы (которые сформированы как время смотрения с шагом 5%) и сколько процентов каждая группа вкладывает в показатели канала.
Видим, что каналы различаются по структуре своих зрителей. В частности, канал «24» – самый стабильный, у него отсутствуют какие-либо «аутлаеры», что делает цифры его выборочного исследования максимально экстраполируемыми на реальность генеральной совокупности. Особенный канал «Еспресо», будто между двух миров: с одной стороны – «112» и NewsOne, с другой – «24» и «5 канал».
Для любителей почитать даю график в виде таблички:
Голубым выделена группа самых простых «аутлаеров», их еще любят называть лояльными. Но эти зрители ведут себя определенным образом. И количество людей аналогичного поведения в генеральной совокупности меньше, чем в группе до 10%. Для расчетов надежности показателей есть смысл рассчитывать их вклад в показатели канала, что уже сделано в таблице. На основе этого можно получить данные, позволяющие оценить гарантированную долю канала в генеральной совокупности:
Фото - liveinternet.ru