У вас имеется выборка из n = 8 наблюдений, характеризующих успешность стартапов в зависимости от наличия рекламной кампании и опытных членов команды, а также того, связан ли стартап с тематикой здоровья. Успех | Реклама | Опыт |
- Статистика
Условие:
Машинное обучение в экономике Семинар 3. Деревья
Задание №1
У вас имеется выборка из n = 8 наблюдений, характеризующих успешность стартапов в зависимости от наличия рекламной кампании и опытных членов команды, а также того, связан ли стартап с тематикой здоровья.
Успех
Реклама
Опыт
Здоровье
1
1
1
0
0
1
1
1
1
0
1
1
0
0
0
1
1
1
1
0
0
0
0
0
1
0
1
0
0
0
1
0
Вы обучаете решающее дерево глубины 2, прогнозирующее успех стартапа с помощью всех имеющихся в данных признаков (реклама, опыт и здоровье). В качестве критерия разбиения используется энтропия (измеряет уровень беспорядка и неопределенности в заданном наборе данных или системе). Прогнозируется, что стартап окажется успешным, если условная вероятность этого события превышает 0.4.
Подсказка: вместо логарифма с основанием 2 эквивалентно использовать натураль-
ный логарифм, необходимые значения которого указаны ниже:
ln(1/8) ≈ −2.079
ln(2/8) ≈ −1.386
ln(3/8) ≈ −0.981
ln(4/8) ≈ −0.693
ln(5/8) ≈ −0.470
ln(6/8) ≈ −0.288
ln(7/8) ≈ −0.134
ln(8/8) = −0.000
ln(1/6) ≈ −1.792
ln(2/6) ≈ −1.099
ln(4/6) ≈ −0.405
ln(5/6) ≈ −0.182
ln(1/5) ≈ −1.609
ln(2/5) ≈ −0.916
ln(3/5) ≈ −0.511
ln(4/5) = −0.223
Изобразите обученное решающее дерево графически, в каждом листе указав долю успешных стартапов.
Используя обученное решающее дерево спрогнозируйте, окажется ли успеш- ным стартап с опытными участниками, без рекламы и посвященный тематике здоровья.
Решение:
Ниже приведён пошаговый разбор решения задачи и окончательный ответ. 1. Исходные данные. Имеем 8 наблюдений с четырьмя столбцами: «Успех» (целевой признак), «Реклама», «Опыт», «Здоровье». По условию среди 8 наблюдений имеется 2 успешных стартапа и 6 неуспешных. 2. Построение дерева с глубиной 2 означает, что сначала выбирается корневой признак для разбиения, а затем – по одному из оставшихся признаков для разбиения подмножества (случая, когда узел не является чистым). Критерием является энтропия, которая измеряет степень неопределенности в узле. 3. Вычисляем энтропию в корневом узле. Вероят...
Похожие задачи
Не нашел нужную задачу?
Воспользуйся поиском
Выбери предмет
- Правоохранительные органы
- Пожарная безопасность
- Парикмахерское искусство
- Природообустройство и водопользование
- Почвоведение
- Приборостроение и оптотехника
- Промышленный маркетинг и менеджмент
- Производственный маркетинг и менеджмент
- Процессы и аппараты
- Программирование
- Право и юриспруденция
- Психология
- Политология
- Педагогика
- Трудовое право
- Теория государства и права (ТГП)
- Таможенное право
- Теория игр
- Текстильная промышленность
- Теория вероятностей
- Теоретическая механика
- Теория управления
- Технология продовольственных продуктов и товаров
- Технологические машины и оборудование
- Теплоэнергетика и теплотехника
- Туризм
- Товароведение
- Таможенное дело
- Торговое дело
- Теория машин и механизмов
- Транспортные средства