1. Главная
  2. Библиотека
  3. Статистика
  4. Используя данные diamonds из библиотеки ggplot2, проверьте гипотезу о взаимосвязи цены (price) и каратов (carat) бриллиант...

Используя данные diamonds из библиотеки ggplot2, проверьте гипотезу о взаимосвязи цены (price) и каратов (carat) бриллиантов при помощи критерия Хи-квадрат. Для этого сначала переведите переменные price и carat в номинальный формат: 1. Создайте

«Используя данные diamonds из библиотеки ggplot2, проверьте гипотезу о взаимосвязи цены (price) и каратов (carat) бриллиантов при помощи критерия Хи-квадрат. Для этого сначала переведите переменные price и carat в номинальный формат: 1. Создайте»
  • Статистика

Условие:

Опять воспользуемся данными diamonds из библиотеки ggplot2. При помощи критерия Хи - квадрат проверьте гипотезу о взаимосвязи цены (price) и каратов (carat) бриллиантов. Для этого сначала нужно перевести эти количественные переменные в формат пригодный для Хи - квадрат. Создайте две новые переменные в данных diamonds:

factor_price - где будет 1, если значение цены больше либо равно чем среднее, и 0, если значение цены ниже среднего цены по выборке.

factor_carat - где будет 1, если число карат больше либо равно чем среднее, и 0, если ниже среднего числа карат по выборке.

Важный момент - на больших данных цикл for() работает довольно медленно, постарайтесь решить эту задачу без его использования!

Используя эти шкалы при помощи Хи - квадрат проверьте исходную гипотезу. Сохраните в переменную main_stat значение критерия Хи - квадрат.

Пример перевода количественной шкалы в номинативную:


> x <- (1, 2, 3, 5, 6, 7) # mean(x) = 4
> factor_x <- (0, 0, 0, 1, 1, 1)

Решение:

Ниже приводится пошаговое решение задачи на языке R с подробными комментариями. ────────────────────────────── 1. Загрузим необходимые пакеты и данные: Мы будем использовать набор данных diamonds из библиотеки ggplot2. Если пакет ggplot2 ещё не установлен, его нужно установить. Код: ------------------------------------------------ library(ggplot2) # загрузка библиотеки ggplot2 library(dplyr) # для удобной работы с данными (необязательно, но удобно) data(diamonds) # загружаем данные ------------------------------------------------ ────────────────────────────── 2. Рассчита...

Не нашел нужную задачу?

Воспользуйся поиском

Выбери предмет