Цифровой актив
Материалы выпуска
Торговый двигатель Рунета Рынок «Цифровизация требует перепрофилирования кадров» Решения Цифровой актив Инструменты «Инновации развиваются, пока не нужно брать на них разрешение» Инструменты Бизнес в кругу друзей Инструменты «Применение ИИ расширяет наши знания о самих себе» Экспертиза Смартфон — деньги — товар Инновации
Инструменты
0
Материалы подготовлены редакцией партнерских проектов РБК+.
Материалы выпуска
Цифровой актив
В ожидании прямой монетизации больших данных рынок совершенствует инструменты для их анализа и ждет понятных правил использования персональной информации.
Фото: Getty Images Russia

Цифровая экономика строится на нарастающих объемах данных: они помогают запускать новые сервисы и увеличить прибыль. По данным экспертов американской McKinsey, предприятия, успешно внедрившие большие данные в свой операционный цикл, демонстрируют рост прибыльности и производительности на 6% по сравнению с конкурентами, которые не используют эти технологии.

Глобально рынок данных вырос с 2011 года в пять раз, примерно до $35 млрд, говорит руководитель дирекции аналитических и индустриальных решений SAS Россия/СНГ Александр Ефимов. По прогнозам компании, к 2027 году его объем превысит $100 млрд. Для обработки данных появляется все более продвинутый инструментарий.

Новая ценность

Лидеры на рынках пользовательских данных — США (с долей около 60%), Великобритания и Китай, отмечают авторы исследования «Большие данные в маркетинге и интернет-рекламе» Ассоциации электронных коммуникаций (РАЭК) и «Газпром-Медиа Диджитал».

В России механизм бирж данных пока не раскручен, однако определенные типы данных уже имеют «хождение». OneAudience.com оценивает объем российского рынка пользовательских данных (то есть данных, которые люди оставляют в интернете) в 2018 году в $34,2 млн при росте на 40%.

В 2017 году, по подсчетам журнала РБК, оборот рынка пользовательских данных в сегментах маркетинга, рекламы и скоринга составил 3,3 млрд руб. Пока это основная сфера применения внешних (то есть приобретаемых на условном рынке) пользовательских данных в России. Здесь наиболее очевидна отдача в том, что большие данные позволяют вовлекать и удерживать клиентов, а также повышать эффективность рекламных кампаний. По данным исследования РАЭК и «Газпром-Медиа Диджитал», основные заказчики рекламных размещений с использованием больших данных — ретейлеры, телеком-компании, автопроизводители, а также компании, работающие в сфере финансов и недвижимости.

Цифровой профиль

Пользовательские данные — наиболее развитый и монетизированный сегмент, считают в «Ростелекоме». На основании похожих характеристик можно определить цифровой профиль пользователя, например автомобилиста или цветовода.

Пока крупнейшие держатели данных — из финансового сектора, телекома, ретейла, транспорта — применяют их преимущественно для решения внутренних задач. По словам гендиректора CleverDATA (входит в группу компаний ЛАНИТ) Дениса Афанасьева, данные о собственных клиентах, включая информацию о покупках, их времени и частоте, категории товаров, а также поведение на сайте компании, используются для персонализированного подхода в коммуникациях.

Отдельные крупные игроки в рамках эксперимента запускают совместные проекты, делясь с партнерами необходимыми для решения конкретной задачи сетами данных в обезличенном виде — идентификаторами.

Не для продажи

Как таковая продажа данных даже в обезличенном виде в России пока не практикуется. Часть данных для своих исследований можно получать бесплатно — такой доступ обеспечивают, например, интернет-гиганты «Яндекс», Mail.Ru Group, Google. В «сыром» виде предоставляют данные геоинформационные сервисы, интернет-магазины и операторы фискальных данных, которые обрабатывают и хранят всю информацию по чекам: место и время покупки, товарные позиции, платежную информацию.

Заметные для рынка инициативы с использованием больших данных развивает Сбербанк, где существуют институты CDO (Chef data officer) и CDS (Chief data scientist), работающие над созданием моделей для проектов по искусственному интеллекту. По словам главы Сбербанка Германа Грефа, искусственный интеллект уже применяется во всех сферах деятельности организации, в том числе в скоринге. Объявлено 259 таких проектов, а доход и экономия от реализации десяти из них составили в 2017 году $13 млрд.

В «МегаФоне» подтверждают, что активно используют накопленные обезличенные большие данные для разработки сервисов для частных лиц, корпоративных клиентов и для внутренних целей. Например, в числе решений, выстраиваемых на глубоком понимании клиента, — тарифные линейки «Управляй!» и «Включайся!», а также «умная» СМС-рассылка «МегаФон. Таргет».

По словам основателя проекта Uremont Артура Терисаяна, его портал ежедневно собирает данные о тысячах автомобилей: это уникальная информация об эксплуатации авто, надежности отдельных узлов и систем на протяжении всего жизненного цикла. Такая информация востребована многими участниками автомобильной отрасли: производителями, страховщиками, банками. База авторемонтов, накопленная порталом, позволяет страховой компании выяснить, были ли серьезные поломки автомобиля и участия в ДТП в прошлом.

Как обращаться с данными

Главная проблема для рынка — отсутствие экспертизы и достаточного представления о том, как эффективно использовать полученные в ходе обработки данных знания. «Еще не у всех сформировалось понимание, что аналитические инструменты для работы с большими данными — необходимое условие для выживания на рынке в ближайшие годы», — комментирует Александр Ефимов. 65% опрошенных SAS признали ценность аналитики, однако считают, что не получают максимальной отдачи от инвестиций в нее.

«Далеко не все имеют представление о том, как безопасно и эффективно использовать и монетизировать данные. Data-подход предъявляет требования не только к технической составляющей проектов, но и к высокому уровню компетенций сотрудников и агентств, работающих с данными», — говорит Денис Афанасьев.

Сдерживает развитие рынка в России и отсутствие четких правил использования персональных данных. В ЕС с мая 2018 года действует новый регламент по защите данных (General Data Protection Regulation, GDPR), который существенно расширил само понятие персональных данных и разделил их на четкие категории.

GDPR распространяется как на европейские организации, так и на филиалы зарубежных компаний, работающие в Европе. Компании обязаны получить согласие пользователей на сбор и обработку персональных данных и быть готовы в любой момент удалить их по запросу владельцев. Под действие регламента не попадают обезличенные данные. Анонимизацию проводят поставщики и биржи данных.

«GDPR ввел высокие штрафы за нарушение правил использования персональных данных, но, по сути, вывел этот рынок из тени», — говорит главный аналитик РАЭК Карен Казарян.

Согласно закону РФ № 152-ФЗ российские операторы персональных данных также обязаны получить письменное согласие от физлиц на их обработку, принять ряд мер по их защите, а также уведомлять о прекращении обработки и уничтожении. Однако отсутствие точной конкретизации, что именно относить к персональным данным, затрудняет развитие инициатив в сфере данных и сохраняет настороженное отношение со стороны потребителей.

По данным Всероссийского центра изучения общественного мнения (ВЦИОМ), 60% пользователей соцсетей отрицательно относятся к использованию данных, на обработку и использование которых сами дали согласие операторам. Всего за последний год информацию в соцсетях размещали 47% интернет-пользователей.

Саморегулирование отрасли, уверены в пресс-службе «МегаФона», будет способствовать культуре совместного использования данных, когда компании накапливают их не только для собственного использования, но делятся с другими игроками. Это повысит уровень защиты потребителей, доверия между участниками рынка и эффективность их взаимодействия.

«Чем более конкретным и детальным будет правовое поле в области использования данных, тем больше будет заинтересованности со стороны бизнеса в использовании данных, в том числе для повышения конкурентоспособности российской экономики», — отмечает директор по развитию бизнеса SAS Россия/СНГ Юлий Гольдберг. Созданная Ассоциация больших данных, считает эксперт, должна помочь продвижению необходимых законодательных инициатив.

Рабочий инструментарий

По словам Юлия Гольдберга, бизнес на данных связан с их аналитической обработкой и использованием в различных бизнес-процессах — обслуживании клиентов, планировании ресурсов, защите от мошеннических атак, управлении рисками, и за прошлый год рынок аналитики в России вырос в денежном выражении более чем на 20%.

Пока что почти 90% необходимой бизнесу информации в моменте можно получать с помощью традиционных инструментов бизнес-анализа. Более продвинутые технологии для работы с большими данными пока достаточно сложно встраиваются в корпоративную ИТ-инфраструктуру и бизнес-процессы.

Согласно отчету SAS «Здесь и сейчас: потребность в аналитической платформе», 27% компаний региона ЕМЕА (Европа, в том числе Россия, Ближний Восток и Африка) аналитика помогла запустить новые бизнес-модели, для 72% сделала их базы данных полезными. 60% респондентов отметили, что аналитические ресурсы сделали более инновационными бизнес-процессы в их компаниях.

Роль аналитических платформ респонденты сводят к интегрированию данных (59%), а также к моделированию и алгоритмам для искусственного интеллекта и машинного обучения (43%), отмечает Александр Ефимов.

Задачи анализа неструктурированного текста и видеоаналитики внедряются в бизнесе медленнее, чем ожидалось, отмечает Юлий Гольдберг: сказываются высокая ресурсоемкость, трудоемкость сбора и подготовки необходимых данных для обучения таких моделей. По мере роста доступности аналитики и средств машинного обучения спрос на решение задач прогнозирования, оценки рисков и оптимизации издержек повышается как со стороны ведущих компаний, так и государства, которое реализует программы развития цифровой экономики.


Что хотят знать маркетологи

Пользовательские данные, которые сегодня могут быть получены и использованы в рекламе, включают в себя:

  • возраст, пол, семейное положение, поведенческие характеристики;
  • местоположение, точное время действий;
  • модели потребления контента;
  • тип устройства, оператор;
  • контентные предпочтения;
  • посещения сайтов;
  • поисковые запросы;
  • активность приложений;
  • информация об активности в соцсетях;
  • история онлайн-покупок.

Пользовательские данные берутся как из собственных источников компаний (CRM, сайты и т.д. — так называемые first-party data), так и у других компаний (second-party data); кроме того, их получают посредством аналитики программатик-платформ и других источников, которые напрямую не соприкасаются с аудиторией (third-party data). Все вместе позволяет лучше узнать аудиторию и сформировать персонализированные сообщения в нужный момент времени.