Назад к списку

Моделирование и прогнозирование цен на аренду автомобилей

Подробнее

Обучение моделей для прогнозирования цен на аренду автомобилей в Японии на основе данных цен и спроса нескольких японских компаний и истории погоды в Японии.

Мы разработали алгоритм, вычисляющий прогноз цен на аренду автомобилей.
В качестве данных для создания модели использовались цены и показатели спроса компаний Orix и NicoNico.

Сначала мы произвели предварительную обработку данных, проанализировав дополнительные сведений о ценах в формате .csv и записав полученные данные в таблицы базы данных MySQL. Затем сравнили с данными в базах данных PostgreSQL, которые содержат информацию о ценах конкурентов, магазинах, расстояниях, а также прогнозные цены на основе обученных моделей, и скорректировали обнаруженные несоответствия.

Конкуренты определяются типом автомобиля, для которого делается прогноз, и расстоянием до ближайших конкурентов в определенном радиусе.

Таблицы базы данных MySQL включают в себя вспомогательные таблицы для сопоставления японских названий с теми, которые используются в коде (таблицы событий, таблицы с данными о погоде, города, магазины, праздники и таблицы услуг, используемые в процессе обучения).

Для обучения используется модель XGBoost с подбором свойств методом перекрестной проверки.

В случае отсутствия реальных данных о погоде на конкретную дату используются вспомогательные модели прогноза погоды. Они получаются с помощью алгоритма обучения, аналогичного тому, который используется для обучения моделей прогнозирования цен и спроса, использующих средние значения за определенный период.

В моделях прогноза цен используется различный набор свойств в зависимости от классификатора модели. Для моделей «цена» и «спрос» классы моделей различаются по компании, типу автомобиля и дополнительным параметрам, используемым при обучении. Для моделей погоды выделяют классы моделей по городу, погоде, для которой предсказывает модель, и дополнительным параметрам, используемым при обучении.

005a0fdbb092e406b11221b29cb36f6131257a7d.jpg
Сервисы
Время разработки
50 недель 1 разработчика
Год
2020