1. Главная
  2. Библиотека
  3. Статистика
  4. Используя данные diamonds из библиотеки ggplot2, проверьте гипотезу о взаимосвязи цены (price) и каратов (carat) бриллиант...

Используя данные diamonds из библиотеки ggplot2, проверьте гипотезу о взаимосвязи цены (price) и каратов (carat) бриллиантов с помощью критерия Хи-квадрат. Для этого создайте две новые переменные в данных diamonds: * `factor_price`: 1, если значение

«Используя данные diamonds из библиотеки ggplot2, проверьте гипотезу о взаимосвязи цены (price) и каратов (carat) бриллиантов с помощью критерия Хи-квадрат. Для этого создайте две новые переменные в данных diamonds: * `factor_price`: 1, если значение»
  • Статистика

Условие:

Опять воспользуемся данными diamonds из библиотеки ggplot2. При помощи критерия Хи - квадрат проверьте гипотезу о взаимосвязи цены (price) и каратов (carat) бриллиантов. Для этого сначала нужно перевести эти количественные переменные в формат пригодный для Хи - квадрат. Создайте две новые переменные в данных diamonds:

factor_price - где будет 1, если значение цены больше либо равно чем среднее, и 0, если значение цены ниже среднего цены по выборке.

factor_carat - где будет 1, если число карат больше либо равно чем среднее, и 0, если ниже среднего числа карат по выборке.

Важный момент - на больших данных цикл for() работает довольно медленно, постарайтесь решить эту задачу без его использования!

Используя эти шкалы при помощи Хи - квадрат проверьте исходную гипотезу. Сохраните в переменную main_stat значение критерия Хи - квадрат.

Решение:

Рассмотрим пошаговое решение задачи. 1. Сначала загрузим необходимые данные – датасет diamonds из библиотеки ggplot2. Если библиотеки ещё не установлены, их можно установить функцией install.packages(), но тут считаем, что ggplot2 уже установлен. 2. Затем вычислим средние значения для переменных price и carat по всему датасету. Это нужно для создания бинарных (0/1) переменных. Если цена (price) равна или превышает среднее значение по выборке, то новая переменная factor_price будет равна 1, иначе – 0. Аналогично для переменной carat формируется factor_carat. 3. Важно использовать векторизиро...

Не нашел нужную задачу?

Воспользуйся поиском

Выбери предмет