Условие задачи
По значениям показателей по регионам Приволжского федерального округа за год изучите зависимость величины годового фонда доходов населения региона (Y) от инвестиций в экономику региона (E).
1. Проверьте исходное множество на наличие в нём территорий с аномальными значениями признаков. Выполните процедуру нормализации исходного множества, исключив территории с аномальными значениями признаков.
2. Расположите территории по возрастанию фактора Х. Сформулируйте рабочую гипотезу о возможной связи фактора и результата.
3. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.
4. Рассчитайте параметры а1 и а0 парной линейной функции и функции радикал третьей степени из фактора .
5. Оцените тесноту связи с помощью показателей корреляции (ryx и ) и детерминации (r2yx и ), проанализируйте их значения.
6. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости a=0,05.
7. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.
8. По лучшему уравнению регрессии рассчитайте теоретические значения результата (), по ним постройте теоретическую линию регрессии и определите среднюю ошибку аппроксимации - ε'ср., оцените её величину.
9. Рассчитайте прогнозное значение результата , если прогнозное значение фактора () составит 1,037 от среднего уровня (). Для уровня значимости 5% рассчитайте границы доверительного интервала возможной реализации прогноза, оцените его точность.
Ответ
1. Проверим исходное множество на наличие в нём территорий с аномальными значениями признаков. Примером цензурирования данных является удаление аномальных наблюдений в соответствии с правилом трех сигм. Согласно этому правилу практически все наблюдения нормально распределенного признаках отклоняются от своего математического ожидания р менее чем на три средних квадратических отклонения : . Наблюдения, не попадающие в интервал, признаются аномальными.