1. Главная
  2. Библиотека
  3. Статистика
  4. Вы прогнозируете вероятность дефолта по кредиту в завис...
Решение задачи

Вы прогнозируете вероятность дефолта по кредиту в зависимости от дохода индивида, используя бэггинг с методом двух ближайших соседей (расстояние Манхэттен) в качестве базового. В случае равного количества 0 и 1 прогнозируется 1. Исходная выборка: Доход |

  • Статистика

Условие:

Задание №2
Вы прогнозируете вероятность дефолта по кредиту в зависимости от дохода индивида. Вы используете бэггинг (технология классификации, где в отличие от бустинга все элементарные классификаторы обучаются и работают параллельно (независимо друг от друга)), в котором в качестве базового используется метод двух ближайших соседей с расстоянием Манхэттен (для классификации).
Как в методе ближайших соседей, так и в ансамбле в случае равного количества 0 и 1 прогнозируется 1. Напомним, что в методе ближайших соседей в обучающей выборке наблюдение является одним из собственных ближайших соседей.


Доходi
Дефолтi
2 0 5
0 1 0
0 0 5
1 1 0
2 0 2
0 1 0
5 2 5
0 0 0
5 5 5
0 0 0
Выборка
Исходная
Бутстрап 1
Бутстрап 2
Бутстрап 3
Бутстрап 4


Получите прогноз дефолта для каждого наблюдения в исходной и бутстрапе рованной выборках. Результат представьте в форме таблицы.
Посчитайте OOB ошибку, руководствуясь критерием точности MAE.

Решение:

Ниже приведён подробный разбор того, как можно получить прогнозы дефолта по наблюдениям с помощью метода двух ближайших соседей в ансамбле бэггинга и посчитать ошибку MAE по наблюдениям, не вошедшим в соответствующие бутстрап‐выборки (OOB). Обратите внимание, что в условии сказано, что при равенстве голосов (по количеству классов 0 и 1) прогнозируем класс 1, а при вычислении прогноза для наблюдения в обучающей выборке само наблюдение включается в число ближайших соседей. Ниже приведён один из вариантов рассуждений – анализ можно проводить именно так. Условие. Имеется исходная выборка из 10 на...

Не нашел нужную задачу?

Воспользуйся поиском

Выбери предмет