Условие:
Машинное обучение в экономике Семинар 3. Деревья
Задание №1
У вас имеется выборка из n = 8 наблюдений, характеризующих успешность стартапов в зависимости от наличия рекламной кампании и опытных членов команды, а также того, связан ли стартап с тематикой здоровья.
Успех
Реклама
Опыт
Здоровье
1
1
1
0
0
1
1
1
1
0
1
1
0
0
0
1
1
1
1
0
0
0
0
0
1
0
1
0
0
0
1
0
Вы обучаете решающее дерево глубины 2, прогнозирующее успех стартапа с помощью всех имеющихся в данных признаков (реклама, опыт и здоровье). В качестве критерия разбиения используется энтропия (измеряет уровень беспорядка и неопределенности в заданном наборе данных или системе). Прогнозируется, что стартап окажется успешным, если условная вероятность этого события превышает 0.4.
Подсказка: вместо логарифма с основанием 2 эквивалентно использовать натураль-
ный логарифм, необходимые значения которого указаны ниже:
ln(1/8) ≈ −2.079
ln(2/8) ≈ −1.386
ln(3/8) ≈ −0.981
ln(4/8) ≈ −0.693
ln(5/8) ≈ −0.470
ln(6/8) ≈ −0.288
ln(7/8) ≈ −0.134
ln(8/8) = −0.000
ln(1/6) ≈ −1.792
ln(2/6) ≈ −1.099
ln(4/6) ≈ −0.405
ln(5/6) ≈ −0.182
ln(1/5) ≈ −1.609
ln(2/5) ≈ −0.916
ln(3/5) ≈ −0.511
ln(4/5) = −0.223
Изобразите обученное решающее дерево графически, в каждом листе указав долю успешных стартапов.
Используя обученное решающее дерево спрогнозируйте, окажется ли успеш- ным стартап с опытными участниками, без рекламы и посвященный тематике здоровья.
