1. Главная
  2. Библиотека
  3. Статистика
  4. У вас имеется выборка из n = 8 наблюдений, характеризую...
Решение задачи

У вас имеется выборка из n = 8 наблюдений, характеризующих успешность стартапов в зависимости от наличия рекламной кампании и опытных членов команды, а также того, связан ли стартап с тематикой здоровья. Успех | Реклама | Опыт |

  • Статистика

Условие:

Машинное обучение в экономике Семинар 3. Деревья
Задание №1
У вас имеется выборка из n = 8 наблюдений, характеризующих успешность стартапов в зависимости от наличия рекламной кампании и опытных членов команды, а также того, связан ли стартап с тематикой здоровья.

Успех
Реклама
Опыт
Здоровье
1
1
1
0
0
1
1
1
1
0
1
1
0
0
0
1
1
1
1
0
0
0
0
0
1
0
1
0
0
0
1
0


Вы обучаете решающее дерево глубины 2, прогнозирующее успех стартапа с помощью всех имеющихся в данных признаков (реклама, опыт и здоровье). В качестве критерия разбиения используется энтропия (измеряет уровень беспорядка и неопределенности в заданном наборе данных или системе). Прогнозируется, что стартап окажется успешным, если условная вероятность этого события превышает 0.4.
Подсказка: вместо логарифма с основанием 2 эквивалентно использовать натураль-
ный логарифм, необходимые значения которого указаны ниже:

ln(1/8) ≈ −2.079
ln(2/8) ≈ −1.386
ln(3/8) ≈ −0.981
ln(4/8) ≈ −0.693
ln(5/8) ≈ −0.470
ln(6/8) ≈ −0.288
ln(7/8) ≈ −0.134
ln(8/8) = −0.000
ln(1/6) ≈ −1.792
ln(2/6) ≈ −1.099
ln(4/6) ≈ −0.405
ln(5/6) ≈ −0.182
ln(1/5) ≈ −1.609
ln(2/5) ≈ −0.916
ln(3/5) ≈ −0.511
ln(4/5) = −0.223

Изобразите обученное решающее дерево графически, в каждом листе указав долю успешных стартапов.
Используя обученное решающее дерево спрогнозируйте, окажется ли успеш- ным стартап с опытными участниками, без рекламы и посвященный тематике здоровья.

Решение:

Ниже приведён пошаговый разбор решения задачи и окончательный ответ. 1. Исходные данные. Имеем 8 наблюдений с четырьмя столбцами: «Успех» (целевой признак), «Реклама», «Опыт», «Здоровье». По условию среди 8 наблюдений имеется 2 успешных стартапа и 6 неуспешных. 2. Построение дерева с глубиной 2 означает, что сначала выбирается корневой признак для разбиения, а затем – по одному из оставшихся признаков для разбиения подмножества (случая, когда узел не является чистым). Критерием является энтропия, которая измеряет степень неопределенности в узле. 3. Вычисляем энтропию в корневом узле. Вероят...

Не нашел нужную задачу?

Воспользуйся поиском

Выбери предмет