Поиск Написать публикацию. Яндекс Как мы делаем Яндекс. Время на прочтение 6 мин.
Как получить цели в Яндекс Такси
Представьте, что вам надо вызвать такси. Вы открываете приложение, видите, что машина приедет минут через семь, нажимаете «Заказать» — и… автомобиль в 15 минутах от вас, если вообще найден. Согласитесь, неприятно. Под катом поговорим о том, как методы машинного обучения помогают Яндекс. Для начала напомним, что пользователь видит в приложении перед заказом: На карте синим отмечены оптимальные точки для посадки в такси.Красный пин — точка, к которой пользователь вызывает такси. В пине отображается, через какое время прибудет машина.
- Са главная задача динамического ценообразования – предоставлять возможность заказать такси всегда. Достигается она с помощью коэффициента surge pricing coefficient, на который умножается
- У сервиса Яндекс Такси есть общие требования к автомобилям, которые могут выполнять заказы в разных тарифах.
- Одна из главных задач в taksitema.ruак сделать так, чтобы к пользователю быстро приезжала машина, а у водителя сокращалось время «холостого пробега» (то есть время, когда он на линии без
- Заказывайте такси в приложении, на сайте или по телефону. Стоимость поездки по городу и в аэропорт известна заранее, подача машины за минут
- Nov , Са главная задача динамического ценообразования – предоставлять возможность заказать такси всегда. Достигается она с помощью коэффициента surge pricing coefficient, на который умножается
В идеальном мире. Но в реальном мире другие люди неподалеку тоже задача яндекс такси себе машину через приложение Яндекс. И мы не знаем, какой автомобиль к кому поедет, ведь они распределяются только после заказа. Если машина уже назначена, для прогноза мы воспользуемся роутингом Яндекс.
Карт и временем при движении по оптимальному пути. Это время возможно, с небольшим запасом мы и покажем пользователю сразу после заказа.
Принцип и суть работы Яндекс Такси
Остается вопрос: а как же спрогнозировать ETA до заказа. И здесь появляется машинное обучение. Составим выборку с объектами и правильными ответами и обучим алгоритм угадывать ответ по признакам объекта.Мы строим цикл заказа таксипроцессы, происходящие под капотом после того, как пользователь нажимает «Заказать» Запустить сервис такси на всю страну было бы очень сложно и дорого, но сделать это в рамках отдельного региона – намного более простая задача, которая требует не так много ресурсов Яндекс Такси. Задача. Создать имиджевую кампанию, направленную повышении лояльности к категории, сделать шаг к демократизации такси как вида универсального транспорта
В нашем случае объекты — это пользовательские сессии, ответы — это время, через которое фактически приехала машина.Признаками объекта могут быть числовые параметры, известные задача яндекс такси заказа: количество водителей и пользователей приложения рядом с пином, расстояние до ближайших автомобилей сервиса и другие потенциально полезные величины. Почему это важно В идеальном мире люди все делают заранее и всегда безошибочно планируют свое время. Но мы живем в реальном мире. Если человек опаздывает на работу или, хуже того, в аэропорт, ему важно понимать, успеет ли он вовремя выехать и добраться до места назначения.
Решая, что заказать, будущий пассажир руководствуется в том числе временем ожидания. Оно может сильно отличаться и задача яндекс такси разных приложениях для вызова такси, и в разных тарифах одного приложения. Чтобы пользователь не пожалел о выборе, очень важно показывать точное ЕТА. Кажется, все. Придумать задача яндекс такси признаков, обучить модель, например CatBoost, спрогнозировать время до прибытия машины — и можно закончить на.
Но опыт показывает, что лучше не спешить и хорошенько подумать, а потом делать.
Но что значит «честным». Ведь любой алгоритм прогнозирования плох или хорош задача яндекс такси статистически.
Добываем информацию
Встречаются и удачные, и откровенно плохие результаты, но нужно «в среднем» не сильно отклоняться от правильных ответов. Здесь надо понимать, что «в среднем» бывает разное. Например, среднее — это как минимум три понятия из статистики: матожидание, медиана и мода.Картинка из великолепной книги Дарелла Хаффа «Как лгать при помощи статистики» прекрасно показывает различие: Мы хотим, чтобы модель в среднем ошибалась мало. В зависимости от значения «в среднем» возникает два варианта оценки качества прогнозов.
Вот как это работает на практике: Система распределения заказов работает автоматически. Когда пользователь заказывает такси, она начинает подбирать автомобиль, подходящий подПервый вариант — показывать пользователю математическое ожидание времени до приезда такси. В итоге обучится модель, минимизирующая средний квадрат ошибки прогноза Mean Squared Error, MSE : Здесь — правильные ответы, — прогнозы модели.
Другой вариант — не ошибаться с прогнозом ETA преимущественно в одну сторону, в большую или в меньшую. В этом случае мы покажем пользователю медиану распределения времени до приезда такси. В итоге обучится модель, оптимизирующая средний модуль ошибки прогноза Mean Absolute Error, MAE : Но мы поняли, что немного забегаем.
Это время и показывается в пине после заказа. С одной стороны, теперь у нас больше информации и прогноз будет точнее, но, с другой стороны, это тоже оценка с погрешностью. Вот в чем оказался подвох в задаче про Задача яндекс такси в пине. Пока водитель не назначен, надо прогнозировать именно то время, которое потом покажет роутинг Яндекс. Карт, а не фактическое время до подачи машины. Казалось бы, что за чушь: вместо точного задача яндекс такси брать в качестве таргета другой прогноз?
Но это задача яндекс такси смысл, и вот.
Почему это важно
По пути к вам назначенная машина может задержаться. Водитель попал в опасную ситуацию на дороге, в пробку из-за Задача яндекс такси или вышел купить воды. Такие задержки сложно предугадать.Са главная задача динамического ценообразования – предоставлять возможность заказать такси всегда. Достигается она с помощью коэффициента surge . Одной из главных задач Яндекс такси является обеспечение комфорта и безопасности наших клиентов во время поездки. Мы берем ответственность за . Команда качества в Яндекс такси выполняет ряд важных задач, которые направлены на обеспечение высокого уровня сервиса и клиентского опыта.
Они создают дополнительный шум в целевой переменной, из-за которого и без того непростая задача спрогнозировать ЕТА в пине задача яндекс такси еще сложнее. Как избавиться от шума. Прогнозировать сглаженную целевую переменную — время, которое показывается уже после назначения машины на основе маршрута к пользователю.В этом есть логика и с точки зрения бизнеса: время в дороге по оптимальному пути из ETA в любом случае не выкинешь, а вот дополнительные задержки можно уменьшать, работая с водителями.
- , Как мы учили taksitema.ru точно рассчитывать стоимость поездки / Хабр. Времяденьги. Как мы учили taksitema.ru точно рассчитывать стоимость поездки. Любой из нас перед покупкой продукта
- Таксиэто сложные алгоритмы поиска водителей, продуктовый подход к разработке и высокая нагрузка на сервисы. Мы используем C++, Python и Go. В Такси есть три .
- Aug , Легко доказать, что эта точка в оптимальном решении должна входить ровно в один отрезок, причём этот отрезок должен быть максимально отодвинут
Метрики качества, данные, модель и обучение Мы выяснили, что для ЕТА в пине нужно прогнозировать не фактическое время, а время, которое будет получено после назначения машины по маршруту. Но у MAE есть приятная особенность: модель более устойчива к выбросам outliers среди обучающих примеров.
Признаки делятся на группы: — построенные по текущему времени; — гео координаты, расстояние до центра города и значимых объектов на задача яндекс такси ; — пиновые сколько и каких машин рядом, по-разному подсчитанная их плотность ; — статистика по зоне как обычно ошибаемся, сколько предсказываем ; — данные о ближайших водителях за какое время доезжают, насколько первый ближе второго и т.
На этих признаках обучали, конечно же, CatBoost. Решающим доводом было то, что реализованный в CatBoost градиентный бустинг над сбалансированными деревьями уже давно зарекомендовал себя как очень мощный метод машинного обучения, а способ кодирования категориальных признаков в CatBoost регулярно оправдывает себя на наших задачах.
Три года назад, в апреле года, мы начали работать с корпоративными клиентами. За это время к сервису Яндекс. Такси для бизнеса подключились больше 23 тысяч компаний в России и Казахстане. Рассказываем, чем мы задача яндекс такси помогаем. Кому и зачем нужен Яндекс. Такси для бизнеса. Подключение к корпоративному сервису Яндекс.
Другая приятная особенность библиотеки — быстрое обучение на GPU.Теперь пара слов о том, какие модели сравнивались. Исходное ЕТА до уточнения машинным обучением рассчитывалось на основе времени, за которое может приехать ближайшая к пользователю машина. Текущая модель используется в приложении сейчас — то, что получилось сделать с помощью машинного обучения и чему посвящена эта статья. Кроме того, в продакшн скоро выкатится новая модель. Она использует на порядок больше значимых для решения задачи признаков.
taksitema.ru открыло услугу межконтинентальной телепортации автомобилей. Телепорт представляет собой замкнутую область (полигон), в котором одновременно могут находиться несколькоВ таблице ниже приводятся замеры качества этих моделей на исторических данных.
К слову, у нас задача яндекс такси ещё много — приходите помогать. Теги: машинное обучение data science такси команда яндекс go. Комментарии Виктор Кантор vkantor. Отправить сообщение. Комментарии Комментарии Лучшие за сутки Похожие. Сайт www. Ваш аккаунт Войти Регистрация.
Мобильное приложение
Подробный разбор решений задач, предложенных участникам онлайн-соревнования по бэкенду Yandex. Taxi Coding Fest. В июле прошло задача яндекс такси по бэкенду Yandex. Перед вами задачи, которые предлагались на соревновании, и их решения с подробным разбором.