Условие:
адача: Представьте, что вы аналитик данных в крупной телекоммуникационной компании. Вам предоставлен набор данных о клиентах, часть которых прекратили пользоваться услугами компании (отток). Ваша задача — построить модель, предсказывающую отток клиентов, и определить ключевые факторы, влияющие на это явление.
Данные: у вас есть следующие данные о каждом клиенте):
CustomerId: Уникальный идентификатор клиента.
Gender: Пол клиента (мужской/женский).
SeniorCitizen: Является ли клиент пенсионером (да/нет).
Partner: Есть ли у клиента партнер (да/нет).
Dependents: Есть ли у клиента иждивенцы (да/нет).
Tenure: Срок пользования услугами компании (в месяцах).
PhoneService: Использует ли клиент телефонную связь (да/нет).
MultipleLines: Использует ли клиент несколько телефонных линий (да/нет/нет услуги).
InternetService: Тип интернет-услуги (DSL, Fiber optic, No).
OnlineSecurity: Использует ли клиент онлайн-защиту (да/нет/нет услуги).
OnlineBackup: Использует ли клиент онлайн-резервное копирование (да/нет/нет услуги).
DeviceProtection: Использует ли клиент защиту устройств (да/нет/нет услуги).
TechSupport: Использует ли клиент техническую поддержку (да/нет/нет услуги).
StreamingTV: Использует ли клиент потоковое телевидение (да/нет/нет услуги).
StreamingMovies: Использует ли клиент потоковое видео (да/нет/нет услуги).
Contract: Тип контракта (Month-to-month, One year, Two year).
PaperlessBilling: Использует ли клиент электронные счета (да/нет).
PaymentMethod: Способ оплаты (Electronic check, Mailed check, Bank transfer (automatic), Credit card (automatic)).
MonthlyCharges: Ежемесячная плата (в долларах).
TotalCharges: Общая сумма платежей (в долларах).
Churn: Произошел ли отток клиента (да/нет) — целевая переменная.
Решение:
Ниже приведён поэтапный план решения задачи прогнозирования оттока клиентов с объяснением каждого шага. ───────────────────────────── Шаг 1. Анализ и очистка данных 1.1. Загрузка набора данных – Импортируйте данные в выбранную среду (например, Python с использованием pandas). – Просмотрите информацию о датасете (используйте df.info(), df.describe()). 1.2. Обработка пропусков и ошибок – Проверьте наличие пропущенных значений. При их наличии примите решение: удалить записи или заполнить соответствующими значениями (например, медианой/модой). – Проверьте корректность формата ...
