Условие задачи
Можно ли на основе демографической информации предсказать объем продаж в магазинах спортивных товаров? В файле СПОРТТОВАРЫ.XLS содержится информация о покупателях в случайно выбранных магазинах, принадлежащих одной франчайзинговой сети. Следовательно, все магазины имеют одинаковый размер и торгуют одинаковыми товарами.
Проанализируйте распределение переменных, процентные доли, определите основные характеристики существующей числовой информации: среднее значение, вариацию и форму распределения… Выявите характер зависимости между переменными. Какие выводы и рекомендации отделу продаж можно сделать?
Дополните свой отчет диаграммами и другой статистической информацией.
Исходные данные - файл СПОРТТОВАРЫ.XLS :
Ответ
Первоначально построим модель по всем имеющимся данным относительно покупок (рис. 1).
Рис. 1
Анализируя значения t и p критериев для коэффициентов регрессии, определяем кандидатов на удаление (те переменные, у которых p-value больше 0,05): Возраст, Пол, Жилье, Брак и Ср_покупки. Исключение этих переменных лучше производить последовательно, поскольку не исключен случай, что при исключении одной из ни...