Условие:
Построить линейную дискриминантную функцию Фишера z=a1x1+...+apxp=a^(T)*X для классификации на два класса. Разбивку на классы сделать по столбцу "правильных ответов". Классификацию проводить по всем признакам, а для визуализации использовать главные компоненты. Использовать t-sne. Данные выбрать из папки cars.csv (Make,Model,Year,Engine Fuel Type,Engine HP,Engine Cylinders,Transmission Type,DrivenWheels,Number of Doors,Market Category,Vehicle Size,Vehicle Style,highway MPG,city mpg,Popularity,MSRP). На языке Python.
Решение:
Для решения данной задачи мы будем использовать язык программирования Python и несколько библиотек, таких как pandas, scikit-learn и matplotlib. Давайте разберем шаги, которые нам нужно выполнить для построения линейной дискриминантной функции Фишера и визуализации данных с помощью t-SNE.
Шаг 1: Импортирование необходимых библиотек
1. : Мы будем использовать все признаки, кроме Make, Model и MSRP (так как это не числовые признаки и не нужны для классификации). 2. : Преобразуем категориальные переменные в числовые с помощью one-hot кодирования. 3. : Классы будем определять по столбцу правильных ответов (например, Vehicle Size). 1. . 2. . Теперь у вас есть пошаговое руководство по построению линейной дискриминантной функции Фишера для классификации автомобилей на основе данных из файла cars.csv, а также визуализация результатов с помощью t-SNE. Вы можете адаптировать код под свои нужды, изменяя целевую переменную или добавляя другие признаки.
