Условие:
Напишите функцию regr.calc, которая на вход получает dataframe c двумя переменными.
Если две переменные значимо коррелируют (p - уровень значимости для коэффициента корреляции Пирсона меньше 0.05), то функция строит регрессионную модель, где первая переменная - зависимая, вторая - независимая. Затем создает в dataframe новую переменную с назанием fit, где сохраняет предсказанные моделью значения зависимой переменной. В результате функция должна возвращать исходный dataframe с добавленной новой переменной fit.
Если две переменные значимо не коррелируют, то функция возвращает строчку "There is no sense in prediction"
Примеры работы функции:
> mydf = iris[,1:2] # на вход подаем данные iris только с переменными Sepal.Length и Sepal.Width
> regr.calc(iris[,1:2]) # переменные значимо не коррелируют
[1] "There is no sense in prediction"
Решение:
Ниже приведён пошаговый разбор решения задачи вместе с итоговым кодом функции на R. ────────────────────────────── Шаг 1. Проверка числа переменных Функция должна получать на вход dataframe с двумя переменными. Для корректности решения можно добавить проверку, что число столбцов действительно равно 2. Если нет – можно вернуть ошибку или сообщение. ────────────────────────────── Шаг 2. Проверка значимости корреляции Необходимо вычислить коэффициент корреляции Пирсона и его p‑значение. Для этого используем функцию cor.test, которая возвращает список с результатами, в том числе p‑значение в э...
