Shape 2 Created with Sketch. Shape 2 Created with Sketch. Shape 2 Created with Sketch. 1588D71D-671A-40A9-96DE-BF5F3C267598 Created with sketchtool. 539A0822-23D1-4EB0-A2B6-ADC1427D73FD Created with sketchtool. BE83D970-80BD-429F-8FEF-15320EFC25BD Created with sketchtool. icon-consulting fb Created with Sketch. F471C7B0-93AA-4A24-B0CB-8EEE8AA343E7 Created with sketchtool. Page 1 Created with Sketch. 8E691C04-FCB2-4D28-A161-E18CE8F4274A Created with sketchtool. icon-increase2 A00BE9EE-9E2C-4B16-A7A4-7ADF0D205D60 Created with sketchtool. 81897709-C9B7-4E51-8F7A-22FEB68F7CAE Created with sketchtool. D2397EF4-D11A-47C4-B4D1-5C8735A936A1 Created with sketchtool. icon-mail microphone Created with Sketch. icon-mvp icon-phone Oval 20 Created with Sketch. icon-research icon-research2 Group 36 Created with Sketch. icon-roadmap 58CDFB41-56B4-4914-9D32-F64663D44F09 Created with sketchtool. icon-team tie Created with Sketch. Imported Layers Copy 6 Created with Sketch. whiskey Created with Sketch. LOGO 50B11FD7-22F2-4934-A094-70A3E7FBFD64 Created with sketchtool.

«Только 3% данных правильно собираются и хранятся»: вот как работать с ними лучше

Сейчас на планете порядка 110 зеттабайт цифровых данных — а к 2025-му их объем превысит 180 зеттабайт. Для понимания, один зеттабайт — это 4K-видео длиной 63 млн лет. Однако в основном эти массивы бесполезны: только 3% данных правильно собираются и хранятся. Лишь эти идеальные данные можно впоследствии проанализировать — и, например, понять, как оптимизировать CJM или поменять интерфейс на сайте, чтобы увеличить продажи.

Вячеслав Жуков, Chief Data Officer в Aero, поделился инструкцией, как добиться высокого качества данных и анализировать их, чтобы не приносить бизнесу убытки.

Какие данные стоит собирать 

В отношении данных работает принцип Парето, то есть 20% данных несут 80% пользы. Например, для eCommerce наиболее ценны записи о воронке продаж и customer journey map, демографический анализ покупателей плюс исторические данные о посещениях, просмотрах и покупках.

Особенно важны детали. Скажем, для анализа воронки продаж нужно, как минимум, понимать: 

  • сколько пользователей за какой период времени посещают витрину, 
  • переходят в каталог и карточки товаров, 
  • доходят до оплаты,
  • сколько заказов оформляют, выкупают и возвращают.

Помимо сбора, важно объединить данные из разных баз, CRM и прочих корпоративных хранилищ. 

Например, чтобы определить процент выкупа, карточку заказа в системах клиентского трекинга нужно связать с карточкой этого же заказа во внутренней системе учета.

Это не так просто — много нюансов связано с меняющимся статусом заказа, жизненным циклом товаров и прочим — зато в итоге бизнес получит максимально правдивые и полные данные для принятия стратегических решений в будущем. 

Как аккумулировать данные правильно

Базовый алгоритм по работе с качеством данных состоит из пяти этапов:

  • Первым делом нужно определить, кто в компании будет отвечать за работу с данными

Иногда эту роль отводят продуктовым менеджерам, аналитикам или вовсе отдают в отдел ИТ. 

Хотя в идеале это должен быть отдельный сотрудник — data owner, владелец данных, или же data steward, распорядитель данных. Такой специалист достаточно глубоко понимает бизнес-цели, при этом обладает техническими компетенциями — и постоянно контролирует, насколько корректно собираются и хранятся данные, подстраивает эти процессы под текущие и новые задачи компании.

  • Собрать руководство по всему жизненному циклу данных

В каком формате собирать, какие метрики применять, где хранить, как часто перепроверять. Можно хранить петабайты данных, но без единого подхода они будут ненадежны или вовсе ошибочны.

 

Это похоже на кошелек с настоящими и поддельными купюрами — вроде деньги есть, но непонятно, чем можно расплатиться.

  • Постоянно повышать качество базы данных

Очищать и структурировать, находить и заполнять пробелы, мапировать — связывать информацию из разных систем. 

  • Настроить систему алертинга

Если происходит какой-то сбой в сборе данных и им нельзя доверять, система должна автоматически оповестить аналитиков и тех, кто принимает бизнес-решения на основе этих данных.

  • Регулярно измерять бизнес-эффект от работы с данными

То есть мониторить, как результаты соотносятся с целями и прогнозами. 

На начальном этапе лучшая стратегия — сузить сбор данных до жизненно необходимого минимума и добиться их максимальной надежности. После можно увеличивать глубину сбора данных и оттачивать алгоритм проверки.


Конечно, в сложных направлениях вроде отслеживания поведения миллионов посетителей интернет-магазина вряд ли получится прийти к стопроцентному качеству. Для таких данных будет достаточно обеспечить чистоту в 90-95% — и тогда бизнес может смело их использовать. В то время как сведения о продажах можно и нужно приводить к абсолютной точности.

Как оценить качество данных 

Понять, насколько корректными получились записи, проще от обратного. К примеру, на данные нельзя опираться, если на сайте есть нерабочие страницы и кнопки. 

Представьте: клиент пытается выбрать новый способ доставки, а он просто некликабельный. Бизнес видит в дашборде «0 пользователей выбрали новый способ доставки», решает, что этот вариант никому не нужен, и отключает функционал — хотя на деле он мог принести ощутимую прибыль. 

Поэтому если замечаете, что данные дублируются, выпадают из медианной зоны или вовсе отсутствуют (хотя вы их собираете) — это верный признак, что они не подойдут для принятия бизнес-решений. И что нужно перепроверить алгоритм их сбора. 

Если же на первый взгляд информация выглядят естественно, примените к ней следующие метрики: 

  • Полнота

Действительно ли данные содержат ключевую для конкретного бизнес-процесса информацию? Так, если вы ритейлер и хотите понять, какие районы предпочитают ваши клиенты, без адресов не обойтись. 

  • Уникальность

Данные не могут повторяться. То есть при регистрации нового пользователя важно проверять, есть ли уже аккаунт с таким же адресом или телефоном. Как и убеждаться при добавлении в каталог нового товара, не занят ли артикул.

  • Согласованность

Противоречить друг другу данные тоже не должны — ошибка наверняка кроется в способе их сбора. Можно свериться с другими инструментами — например, сервисом веб-аналитики сайта или 1С.

  • Валидность

Данные должны быть достоверными. То есть дата рождения клиента не может быть «40.02.2030», а размер ноги — «-67».

  • Актуальность

Если данные устарели или больше не используются, стоит перевести их в «холодное хранение» — минимизировать ресурсы на их содержание. Например, сжать файлы или перейти на более простое оборудование.

  • Точность

Данные важно собирать однотипно, строго по регламенту, с учетом необходимого промежутка времени и других критериев. Иначе потом их будет сложно структурировать и анализировать — по крайней мере, автоматически.

  • Систематичность

Бизнес должен аккумулировать информацию на протяжении всей своей жизни. Только собранные в базу данные имеют смысл — когда их можно сравнивать с прошлыми и прогнозируемыми показателями. 

Это основные метрики качества, но далеко не все. 

Финансовые компании, например, дополнительно оценивают данные с точки зрения:

  • их контролируемости (возможности оценить качество и происхождение),
  • восстанавливаемости (возможности вернуть информацию после удаления или повреждения).

Измерить разницу между некачественными и качественными данными можно и в деньгах: в том же исследовании HBR говорится, что здесь применимо «правило десяти». Например, если есть идеальные данные для каждой из 100 задач, на выполнение уйдет $100. А если данные корректны только для половины из них, стоимость составит 50 х $1 + 50 х $10, то есть уже $550. 

Неверные данные могут только замедлять процессы и привлекать новые ошибки, только уже более глобальные. Поэтому мой совет: инветсировать в точные, полные и актуальные данные. 

Главное не гнаться за количеством без качества — иначе решения на основе такой датабазы станут для бизнеса «русской рулеткой». 

Мнение эксперта опубликовано на Rusbase

Тренды, аналитика, кейсы, вакансии eCommerce в нашей рассылке

Благодарим вас за подписку! В ближайшее время пришлем вам интересные статьи

Этот адрес уже подписан на нашу рассылку




Делимся опытом

Обсудим ваш проект

Мы подбираем индивидуальные условия и схемы работы под конкретный проект, продукт и набор ИТ-систем.

Расскажите о целях, задачах, сроках и бюджете вашего проекта как можно подробнее. Это поможет нам лучше вникнуть и сделать вам предложение намного быстрее.

Согласен на обработку персональных данных. Подробнее об обработке данных читайте в Политике

Согласие на обработку персональных данных

×

Физическое лицо, оставляя заявку на веб-сайте www.aeroidea.ru через форму «Обсудим ваш проект» и форму подписки на e-mail рассылку, действуя свободно, своей волей и в своем интересе, а также подтверждая свою дееспособность, предоставляет свое согласие на обработку персональных данных (далее — Согласие) Обществу с ограниченной ответственностью «АЭРОКОМ» (ООО «АЭРОКОМ») (ИНН 9705136776, info@aeroidea.ru, +7(495)120-12-38, +7 968 900-23-45), которому принадлежит веб-сайт www.aeroidea.ru и которое зарегистрировано по адресу 111024, г. Москва, вн.тер.г.муниципальный округ Лефортово, ул. Авиамоторная, д.50, стр.2, этаж 2, помещ.XI, комната 25, офис А79, на обработку своих персональных данных со следующими условиями:

  1. Данное Согласие дается на обработку персональных данных, как без использования средств автоматизации, так и с их использованием.
  2. Согласие дается на обработку следующих моих персональных данных: персональные данные, не относящиеся к специальной категории персональных данных или к биометрическим персональным данным: адрес электронной почты (e-mail); имя; сведения о месте работы; номер мобильного телефона.
  3. Цель обработки персональных данных: обсуждение возможного проекта.
  4. В ходе обработки с персональными данными будут совершены следующие действия: сбор; запись; систематизация; накопление; хранение; уточнение (обновление, изменение); извлечение; использование; передача (предоставление, доступ); блокирование; удаление; уничтожение.
  5. Третьи лица, обрабатывающие персональные данные по поручению ООО "Аэроком” для указанной в согласии цели:
    • АО "АМОЦРМ", 21205, г. Москва, вн.тер.г. Муниципальный Округ Можайский, Тер Сколково Инновационного Центра, б-р Большой, д. 42 стр. 1
    • ООО "Яндекс", 119021, г. Москва, ул. Льва Толстого, д. 16
  6. Персональные данные обрабатываются в течение 30 дней с момента отказа в дальнейшем обсуждении проекта или с момента принятия решения о заключении договора на проект в соответствии с ч. 4 ст. 21 152-ФЗ, смотря что произойдет раньше.
  7. Согласие может быть отозвано вами или вашим представителем путем направления ООО "Аэроком” письменного заявления или электронного заявления, подписанного согласно законодательству Российской Федерации в области электронной подписи, по адресу, указанному в начале Согласия.
  8. В случае отзыва вами или вашим представителем Согласия ООО "Аэроком” вправе продолжить обработку персональных данных без него при наличии оснований, указанных в пунктах 2 — 11 части 1 статьи 6, части 2 статьи 10 и части 2 статьи 11 Федерального закона № 152-ФЗ «О персональных данных» от 27.07.2006 г.
  9. Настоящее согласие действует все время до момента прекращения обработки персональных данных, указанных в п. 6 и п. 7 Согласия.

eCommerce стикеры №1

Мы нарисовали первый eCommerce стикерпак, чтобы вам было еще проще обмениваться своими эмоциями!

Telegram iMessage

eCommerce стикеры №1

Первый стикерпак для интернет магазинщиков