Условие:
Необходимо разработать программу для анализа представленной информации. Программа должна состоять из модулей (файлов), каждый из которых предназначен для выполнения определённых этапов.
Модуль 1 (анализ данных)
В модуле необходимо:
1. Вывести информацию о наборе данных. Определить количество записей, тип данных каждого столбца, наличие пропущенных значений в наборе данных.
2. Напечатать первые 10 и последние 10 записей из набора данных.
3. Сравнить показатели, представленные в таблице. Сделать обоснованные выводы об успешности модернизации сайта.
Дата посещения Среднее время пребывания на сайте Доля
зарегистрированных пользователей
До 01.05.2024 (до модернизации)
После 01.05.2024 (после модернизации)
Сохранить таблицу в отдельный файл.
4. Построить гистограммы распределения и boxplot для столбца Продолжительность (до модернизации) и Продолжительность (после модернизации), сделать выводы.
5. Вывести статистику посещения сайта по месяцам: количество посещений, количество регистраций, количество обращений в службу поддержки, количество сохранений, наличие факта навигации по сайту. Данные представить в виде таблицы и диаграмм.
6. Определить статистику перехода на сайт с различных платформ до и после 01.05.2024 и сделать обоснованные выводы.
7. Сформировать статистику посещений сайта в зависимости от времени суток. Результат представить в виде таблицы и диаграммы. Сделать выводы.
Модуль 2 (кластерный анализ)
8. Повести кластеризацию данных таблицы до и после модернизации. Сделать выводы.
Модуль 3 (задачи классификации/регрессии)
9. Разработать два классификатора (нейронная сеть, логистическая регрессия), позволяющих спрогнозировать регистрацию на сайте. Оценить качество каждого классификатора и сделать выводы для владельца сайта. Каждый классификатор сохранить в отдельный файл. Протестировать работу классификатора на 2-3 объектах.
