Кратко

tl;dr

ЕВРАЗ предлагает вам окунуться в ключевой процесс производства стали – продувку чугуна.

Разработайте модель, предсказывающую содержание углерода и температуру чугуна во время процесса продувки металла. Самое время расчехлить свой XGBoost и настекать как следует фичей.

А мы вам расскажем, почему задача соревнования очень важна для ЕВРАЗа.

Контекст

При производстве стали чугун "продувается" кислородом для удаления примесей. Этот процесс идёт в среднем 15-25 минут при температуре около 1600 градусов. За процессом следит машинист дистрибутора, который на основе своего опыта и специальных знаний определяет момент, когда процесс продувки нужно остановить. В процессе продувки металл насыщается кислородом, а его температура увеличивается. Если "передуть" чугун – сгорит больше металла и на выходе будет меньше стали, что приведет к потере прибыли, если "недодуть", то марка стали не будет удовлетворять заданным критериям и нужно будет "додувать", что замедляет производительность цеха.

Вам предстоит разработать алгоритм прогнозирования параметров чугуна – что может стать отличным помощником для машиниста и существенно улучшить производство ЕВРАЗа

Описание задачи

🧩 Формулировка

Задача - разработать алгоритм ****предсказания содержание углерода и температуру чугуна.

В этой задаче две подзадачи

  1. Реализовать алгоритм, предсказывающий содержание углерода и температуры чугуна на момент конца плавки металла
  2. Задача из реального мира – придумать как обобщить алгоритм из пункта 1 на ситуацию реального производства. В реальном времени мы не знаем, когда наступит конец продувки, а должны определить это сами на основании прогнозируемых параметров чугуна. Что нужно добавить? Как перейти от модельной задачи к задаче из реального мира? Как развить алгоритм так, чтобы это было максимально полезно бизнесу?

📊 Данные

Исходные данные

В рамках этой задачи вам будут даны данные о продувки чугуна в цехе:

Вы можете посмотреть атрибутный состав данных по ссылке ниже. Совет – можете выбрать "все атрибуты" или интересующую вас таблицу

как выбрать интересующие атрибуты

как выбрать интересующие атрибуты

Атрибутный состав данных