Атрибутный состав данных Raifhack DS
Коды ошибок
Описание задачи
Банки выдают кредиты, в том числе, под залог недвижимости. Для компании это страховка, а для клиента — возможность получить больше под меньший процент. Каждый объект залога оценивают: жилые с помощью ИТ (например, SRG group или «Мобильный оценщик»), а вот коммерческие — чаще вручную. Полноценного автоматизированного инструмента для оценки коммерческой недвижимости пока никто не анонсировал.
<aside>
✅ На основании данных о продаже коммерческой недвижимости необходимо построить модель, прогнозирующую изменение цен
</aside>
Проблематика
- Чего мы хотим:
- Оценка вручную занимает много времени (долгая оценка = задержка решения по выдаче кредита → можно потерять клиента).
- Отдельные специалисты обычно рассматривают небольшой сегмент рынка (5-10 ближайших аналогов вместо сотен подходящих объектов) — и могут ошибиться.
- В чем трудность:
- Оценка вручную занимает много времени (долгая оценка = задержка решения по выдаче кредита → можно потерять клиента).
- Отдельные специалисты обычно рассматривают небольшой сегмент рынка (5-10 ближайших аналогов вместо сотен подходящихобъектов) — и могут ошибиться.
- В чем интерес:
- Актуальная задача регрессии на табличках — для тех, кто соскучился по классике
- Работа с реальными данными и нестандартная метрика, приближенная к потребностям бизнеса
- Опыт интерпретации результатов модели (interpretable ml, causal inference) — отдельно отметим лучшие подходы
- Возможность отточить навыки в построении правильного алгоритма валидации, на 100% приближенного к проду.
Данные
Продажи коммерческой недвижимости за 2020 год, состоящие из трех частей:
- Общая обучающая: 100-150 тыс. записей до 09.2020