Анализ потребительских предпочтений с помощью SHAP-модели на рынке HoReCa

Один из наших Клиентов - сеть ресторанов в Москве, обратился к нам за разработкой стратегии и позиционирования своих заведений. 

В рамках поиска формата мы решили проанализировать клиентские предпочтения аудитории, выявить то, какие факторы влияют на оценки пользователей после посещения кафе/ресторана. 

Мы обратились к открытым источникам, главным критерием выбора которых стало наличие подробной информации о заведениях Москвы: формат, разновидность кухни, отзывы, стоимость и рейтинг от посетителей. TripAdvisor прекрасно подошел для выполнения данной задачи.

Проблемы подобного решения:

  1. Отсутствие возможности выгрузки статистики;

  2. Данная статистика не отражает зависимость между критериями заведения и оценками пользователей.

Как мы это преодолели:

  • Разработка парсера, который позволил в оперативном режиме выгрузить все необходимые данные по 9 245 заведениям Москвы;

  • По итогам выгрузки мы построили интерактивный дашборд с общей статистикой;

Frame 268.png

*Оставьте свои контакты и мы поделимся ссылкой на данную выгрузку 

Для верной интерпретации графиков развернули SHAP-модель, что позволило выявить корреляцию между характеристиками заведения и оценками пользователей.

Как характеристики заведения влияют на оценку клиента?

Немного о подходе

SHAP расшифровывается как SHapley Additive explanation. Этот метод помогает разбить на части прогноз, чтобы выявить значение каждого признака. Он основан на Векторе Шепли, принципе, используемом в теории игр для определения, насколько каждый игрок при совместной игре способствует ее успешному исходу.

SHAP можно использовать для разных целей, при анализе параметров ресторана, как в нашем случае, или, например, в HR-аналитике, чтобы сформировать портрет сотрудника, который с наибольшей вероятностью покинет рабочее место. Везде, где необходимо кластеризовать большие данные и найти взаимосвязи между группами параметров. 

Что мы получили 

Полученный график интерпретируется следующим образом:

По Y оси - сила влияния конкретного фактора на рейтинг: чем выше находится строчка ( в красной зоне), тем сильнее она влияет на оценку посетителей. 

Точки внутри - это конкретные рестораны, которые подпадают под данный критерий.

Чем больше красных точек сбивается вправо, тем позитивнее сказывается параметр на оценке заведения и наоборот. 

По итогам анализа мы выделили критерии, положительно влияющие на рейтинг ресторана: 

• Гастропабы; 

• Итальянская кухня; 

• Современная; 

• Здоровое питание; 

• Барбекю 

• Восточно-европейская кухня

Именно такие заведения в среднем гораздо чаще получают высокую оценку. А заведения японской кухни, фастфуд или кафе Клиенты оценивают более активно, но уже в негативном ключе.

В итоге с помощью моделирования и анализа клиентского опыта мы решили выстроить позиционирование Клиента в тематике восточно-европейской кухни.

Таким образом, используя только открытые источники данных и собственные наработки, мы смогли сформировать позиционирование и стратегию для нашего Клиента, а также провести анализ потребительских предпочтений и выявить актуальные тренды в сфере HoReCa.