Условие:
Задание №2
Вы прогнозируете вероятность дефолта по кредиту в зависимости от дохода индивида. Вы используете бэггинг (технология классификации, где в отличие от бустинга все элементарные классификаторы обучаются и работают параллельно (независимо друг от друга)), в котором в качестве базового используется метод двух ближайших соседей с расстоянием Манхэттен (для классификации).
Как в методе ближайших соседей, так и в ансамбле в случае равного количества 0 и 1 прогнозируется 1. Напомним, что в методе ближайших соседей в обучающей выборке наблюдение является одним из собственных ближайших соседей.
Доходi
Дефолтi
2 0 5
0 1 0
0 0 5
1 1 0
2 0 2
0 1 0
5 2 5
0 0 0
5 5 5
0 0 0
Выборка
Исходная
Бутстрап 1
Бутстрап 2
Бутстрап 3
Бутстрап 4
Получите прогноз дефолта для каждого наблюдения в исходной и бутстрапе рованной выборках. Результат представьте в форме таблицы.
Посчитайте OOB ошибку, руководствуясь критерием точности MAE.
