Условие:
Кейс 1. Сравнение классификаторов на наборе «Титаник»
Описание данных Для этой задачи используйте встроенный в seaborn набор данных о пассажирах «Титаника». Он содержит информацию о поле, возрасте, классе обслуживания, цене билета и факте выживания.
Задания
1. Предобработка. Выберите и заполните или удалите пропуски в столбцах , , . Переведите категориальные признаки , , в числовые (one-hot или label encoding).ageembarkeddecksexembarkedclass
2. Разбиение. Разделите данные на тренировочную (70 %) и тестовую (30 %) выборки с фиксированным .random_state
3. Обучение моделей. Обучите на тренировке три классификатора:\no Логистическую регрессию (LogisticRegression)\no Случайный лес (RandomForestClassifier)\no Метод опорных векторов (, с выводом вероятностей через SVCprobability=True)
4. Оценка. Для каждого классификатора на тестовой выборке рассчитайте следующие метрики: , , , и . Постройте ROC-кривые всех трёх моделей на одном графике.accuracyprecisionrecallF1-scoreROC-AUC
5. Сравнение. Сводно представьте все метрики в таблице и сделайте вывод, какая модель в целом показала наилучшую производительность и в каких аспектах (точность vs полнота vs AUC).

