Из-за неразберихи в базе производителя появляются дубли — одинаковые точки продаж, которые зарегистрированы как разные. В этой статье я расскажу, откуда берутся дубли, чем они мешают бизнесу и как DaData.ru приводит в порядок базы производителей.
Откуда берутся дубли торговых точек
Дистрибьюторы создают дубли, потому что так проще считать. Обычное дело, когда торговая точка объединяет несколько юридических лиц.
В ТЦ «Гранд» дистрибьютор работает с шестью юридическими лицами. Им отгружают разные товары, по-разному считают продажи.
Для простоты дистрибьютор создает каждому юрлицу отдельную запись, хотя все они находятся в одном ТЦ.
У дистрибьюторов нет единого формата для адресов. В базе появляются дубли, когда в разных отчетах адрес одной торговой точки пишут по-разному.
Один и тот же адрес в Екатеринбурге:
- 620026, Свердловская область, Екатеринбург, Луначарского, 210в;
- Екб, Луначарского 210в;
- 620026, Ебург, Луначарского — 210-в.
Одни дистрибьюторы включают в отчеты торговые названия, другие — названия юрлиц.
Когда магазин «Премьер» принадлежит ООО «Вектор плюс», в отчетах обязательно будут расхождения.
Почему дубли торговых точек вредят бизнесу
Непонятно, на какие продажи рассчитывать. Если в базе дубли, производитель неправильно оценивает размер клиентской базы. Он считает, что точек сбыта достаточно и ошибается в планах.
Дистрибьюторы присылают производителю 100 точек продаж. Он составляет план, рассчитывая, что каждая из 100 точек закупит у него товар на 100 ₽.
Итоговый отчет показывает, что товара продали на 3000 ₽ вместо ожидаемых 10000 ₽.
Выясняется, что уникальных точек продаж только 30, а остальное — дубли. Знай производитель этом заранее, он бы составил правильный план и поработал над расширением клиентской базы.
Торговые представители работают вполсилы. Из-за дублей торговых точек производитель нанимает больше торгпредов, чем нужно. Об ошибке торгпреды не рассказывают: на бумаге они загружены, зарплата все та же, а работы меньше.
Вдобавок начинается хаос с маршрутами. Торговые представители бессистемно ездят между дублями и реальными точками, тратят рабочее время впустую.
Торговые точки получают лишние бонусы. Иногда производители устраивают трейд-маркетинговые акции.
Типичный сценарий трейд-маркетинговой акции — купи товар на определенную сумму и получи бонус.
Когда точки-дубли делают подходящий заказ, каждая получает бонус. Реально же награда должен быть только одна.
Как бороться с дублями торговых точек
С дублями торговых точек борется сервис DaData.ru. В него загружают excel-файл с необработанными данными и указывают, как искать дубли: только по адресу или по адресу и названию.
Чтобы привести список точек в порядок, «Дадате» нужно три шага.
Стандартизовать названия. Дистрибьюторы пишут названия торговых точек как хотят. Иногда к названию добавляют еще и свободный комментарий.
Типичный список торговых точек от дистрибьютора:
- Евразия
- ТЦ "Доминант"
- "САКУРА" Японская кухня
- ООО "НПКП Лимит"
- Милениум, ООО, продуктовый магазин
- Туголуков А.С. ИП
- Доминант
- Киви/ООО/Челябинск
Названия №2 и №7 одинаковы, но привычными средствами вроде Excel этого не найти: слишком по-разному написано.
При поиске дублей «Дадата» убирает из названий лишнее: организационно-правовую форму («ИП»), куски адреса («ЧИТА»), тип точки («универсам»), другой мусор («ДОГОВОРА НЕТ»).
Чистые названия сервис сравнивает по специальному алгоритму с учетом похожести.
«Дадата» понимает, что:
- «Доминант» и «ТЦ "Доминант"» — одно и то же;
- «Социальная аптека №121» и «Социальная аптека №122» — разные названия, хотя и похожие.
Привести адреса к одному формату. Очевидный сценарий — объединить торговые точки по адресам. Но работать с адресами в том виде, что присылают дистрибьюторы, нельзя: у каждого свое видение правильного формата, приправленное ошибками.
«Дадата» приводит адреса в порядок:
- Исправляет опечатки и сокращения.
- Дополняет адрес: находит индекс, восстанавливает пропущенный населенный пункт.
- Приводит к формату ФИАС.
- Ставит метки: точно ли распознан адрес и до какого уровня.
Для каждого адреса «Дадата» собирает карточку с данными.
Распознанные адреса, для которых «Дадата» нашла коды КЛАДР и ФИАС, можно сразу использовать: включать в отчеты, отправлять торгпредам, а главное, искать по ним дубли.
Адреса, которым сервис поставил метку «Не распознан», производители возвращают дистрибьюторам для уточнения.
Объединить дубли. Когда «Дадата» привела названия и адреса в порядок, она ищет дубли.
Например, «сырой» список торговых точек выглядит так:
В нашем примере «Дадата» соберет в одну запись данные о точке «Доминант» и вернет excel-файл пользователю.
Если точки выглядят как одинаковые, но сервис не уверен на 100%, он ставит метку «Похожие». Такие точки обрабатывают вручную.
Бонус к слиянию дублей — восстановленные и стандартизованные адреса, чистые названия и ОПФ отдельным полем.
Дубли торговых точек ищут на сайте DaData.ru. Причем сервис сначала проверяет файл и показывает, сколько дублей нашел. По отчету можно решить, стоит ли платить за очистку базы.
Производители, которые внедрили «ST Чикаго», ищут дубли торговых точек в интерфейсе SFA. Для начала адреса приводят к одному формату: «ST Чикаго» сама отправляет их в «Дадату». А затем запускают встроенный в SFA инструмент поиска дублей.