В данной статье мы поговорим о том как на протяжении последних двадцати лет интернет развивался семимильными шагами, а геотаргетинг, используемый в рекламных сервисах, остался примерно таким, каким он был в прошлом тысячелетии, игнорируя все технические модификации, которые произошли во всемирной сети.
Для начала разберёмся, как работает показ рекламы по заданному списку областей и городов — сокращенно «геотаргетинг».
Почти во всех системах (если не всех) реализация до боли проста:
Первая погрешность вытекает из способов сбора и контроля корректности базы — в большинстве случаев база пополняется исходя из регистрационных данных, которые предоставил покупатель данного блока адресов (в большинстве случаев провайдер). Данные о блоке регистрируются при покупке и теоретически должны обновляться периодически по информации, которую предоставляют провайдеры, но фактически информация об изменениях поступает с большой задержкой или не поступает никогда.
Некоторые поставщики баз пытаются делать корректировки для решения данной проблемы техническими методами (контроль сетевой трассировки и т.п.), но не всегда успешно. Более скрупулёзно к этому подходя в странах, где такие базы активно покупают, к сожалению, Россия не в их рядах.
Вторая проблема состоит в том, что данные для блоков адресов не всегда заполняются при регистрации, а покупатель не контактирует с поставщиками геобаз. Поэтому 80% блоков в таких базах привязаны к России, но не привязаны к региону, можно предположить, что это неактивные адреса, но нет... Каждый день 40% запросов за рекламой относится к таким блокам.
Ощутить эту проблему тоже несложно - если вы владелец сайта или ведете чью-то рекламную компанию, сделайте выгрузку траффика с группировкой "IP-адрес", "Город" (обе одновременно и именно в таком порядке). Я получил пресловутые 40% "Не определено" на месте значения "Город".
Третья проблема — IP адрес не всегда может соответствовать одному городу. Данная проблема наиболее актуальна для мобильного траффика — к примеру, у оператора сотовой связи Билайн лишь один IP блок на центральные регионы России (за исключением Москвы — здесь отдельный блок на 1024 IP адреса).
Как следствие, к примеру, невозможно отличить Рязанскую, Тульскую и Орловскую области для пользователей, открывающих сайт под мобильным интернетом от Билайн. Это актуально для большинства операторов мобильного интернета — все они активно используют технологию DNAT и обходятся очень малым количеством IP адресов для обслуживания всего мобильного интернета.
С учетом того, что на текущий момент 30-40% процентов уникальных пользователей использует мобильный интернет, для рекламной отрасли это очень ощутимая проблема.
Мобильного траффика ощутимо меньше 30% (в байтах), но рекламу это не спасает, так как любой опытный трафик менеджер показывает ее с ограничениями по частоте показов (CPA сети не трогаем, там и геотаргетинг не особо актуален).
Данные проблемы особо актуальны для медийной рекламы, направленной на определенные города или регионы. Цель данной рекламы увеличить узнаваемость бренда, то есть привлечь новую аудиторию на сайт и заставить ее принять целевое решение на длинном промежутке времени.
Начнем с очевидного технического решения. Мы используем несколько поставщиков гео-данных и чуть более достоверные данные получаем за счет выбора результата, имеющего наибольшее количество голосов среди источников (геобаза Yandex лишь один из участников "голосования").
Далее, тяжелая артиллерия, направленная на решение проблемы с отсутствием гео для 40% россиян.
У нас есть 240 миллионов уникальных устройств промаркированных с помощью cookie и многие из них мобильные (то есть физически перемещаются). Мы аккуратно экстраполировали достоверные ip-адреса на их перемещение.
Данный подход позволил актуализировать большое количество адресов, ошибочно привязанных к неверным городам. Объясним на практике:
Показания геобаз относительно блока адресов 17.118.93.0/24 сильно разнятся:
IP2Location: Нижний Новгород
ipinfo.io: Казань
DB-IP: Москва
ipdata.co: Казань
Большинство за Казань, но похоже эта информация устарела.
На интервале в 10 дней мы наблюдали 110000 уникальных устройств, которые сгенерировали траффик с блока ip адресов 217.118.93.0/24, и в эти же дни 30% из них генерировали траффик с адресов, однозначно относящихся к Нижнему Новгороду, лишь 3% из данных устройств выходили в интернет с адресов, относящихся к другим городам.Тут можно смело делать вывод что 217.118.93.0/24 сейчас используется провайдером (стационарный интернет от Билайн) где-то в Нижнем Новгороде.
И последний подход, позволивший нам показывать рекламу, нацеленную на малые города через мобильный траффик. Помимо возможности настраивать компанию по принципу: "показывать рекламу, если пользователь находится в городе X" мы добавили возможность настройки "показывать рекламу, если пользователь бывал в городе X, в течение последних N дней".
Мобильное устройство в течение дня подключается к Wi-Fi роутерам. Роутеры в большинстве случаев отправляют трафик через провайдеров стационарного интернета. С ip-адресами провайдеров мы научились работать и знаем, к каким городам относятся их адреса.
Решим проблему показа рекламы абонентам Билайн в городе Орел.
Если мобильное устройство использует Билайн, но в течение 2-ух дней обращения в интернет происходили с адресов выделенных под город Орел, мы считаем, что на данном устройстве нужно показать рекламу, направленную на жителей Орла (конечно же, при соблюдении остальных условий таргетинга).
Да, возможно, что физически человек уехал из Орла (самое неприятное, если он был в городе проездом), но в большинстве случаев он периодически пребывает в этом городе, а значит входит в целевую аудиторию.
Последняя настройка, кстати, позволяет отлавливать пользователей, которые проводят рабочие дни вне дома.
Но это уже другая глава этой истории ...