Условие:
Будем по признакам 'Hair length','Shoe size' предсказывать признак 'Sex'. Загрузите эти признаки из таблицы students.csv
Пронормируйте признаки 'Hair length','Shoe size' используя StandardScaler
Запустите модель SGDClassifier(randomstate=0) (нужно написать фразу randomstate=0, чтобы у всех обучающихся был одинаковый ответ), и получите предсказания для студентов из тестовой выборки studentstest.csv
С помощью команды pd.crosstab постройте матрицу ошибок (таблицу сопряженности) предсказанного и истинного пола студентов.
В отчет запишите количество студентов мужского пола, которые были детектированы как мужчины.
Решение:
Для выполнения вашей задачи, вам нужно будет выполнить несколько шагов. Давайте разберем их по порядку.
1. Загрузить данные из файлов students.csv и students_test.csv.
2. Нормализовать признаки Hair length и Shoe size с помощью StandardScaler.
3. Обучить модель SGDClassifier и сделать предсказания на тестовой выборке.
4. Построить матрицу ошибок с помощью pd.crosstab.
5. Записать количество студентов мужского пола, которые были детектированы как мужчины.
Вот пример кода, который выполняет все эти шаги:
