1. Главная
  2. Библиотека
  3. Информационные технологии
  4. Выберите ситуации, которые в машинном обучении принято...
Решение задачи на тему

Выберите ситуации, которые в машинном обучении принято относить к категории утечки данных (data leak): A Включение целевого признака в обучающий набор данных. B Включение некоррелированных с целевой переменной факторов в обучающий набор данных. C

  • Информационные технологии
  • #Машинное обучение и анализ данных
Выберите ситуации, которые в машинном обучении принято относить к категории утечки данных (data leak):
A Включение целевого признака в обучающий набор данных.
B Включение некоррелированных с целевой переменной факторов в обучающий набор данных.
C

Условие:

Выберите ситуации, которые в машинном обучении принято относить к категории утечки данных (data leak):
A Включение целевого признака в обучающий набор данных.
B Включение некоррелированных с целевой переменной факторов в обучающий набор данных.
C Включение столбца «расстояние до конечной точки маршрута» при прогнозировании длительности поездки.
D Включение столбца «время окончания поездки» при прогнозировании длительности поездки.

Решение:

Рассмотрим каждую ситуацию по шагам.

  1. Ситуация A. Включение целевого признака в обучающий набор данных означает, что модель получает прямую информацию о том, что она должна предсказать. Это классический пример утечки данных, потому что модель «подглядывает» ответ во время обучения.

  2. Ситуация B. Включение факторов, не коррелирующих с целевой переменно...

Выбери предмет