Условие:
Выберите вопросы, которые помогут Вам максимально точно определить, на каких этапах решения задачи классификации ошибся стажер:
Вы являетесь специалистом в области обработки и анализа данных. На текущий момент ваша команда занимается разработками прототипа промышленной NLP-системы. Вместе со стажером вы работаете над алгоритмической частью задачи классификации текстов. Вы являетесь опытным специалистом и обучаете стажера. Проверяя результаты его работы, вы обнаруживаете, что результаты, основанные на работе с «мешком слов», оказались низкого качества. Вы склоняетесь к тому, что выбрали верный алгоритм предобработки данных и классификатор, поэтому теперь Вам нужно разобраться, где стажер допустил ошибку, чтобы исправить ее.
い
Выберите вопросы, которые могут Вам определить архитектуру решения:
Как проходил этап фильтрации данных?
Формирование векторов признаков осуществлялось по полной матрице или свернутой?
Какая библиотека использовалась для токенизации текстов?
Какой классификатор использовался?
