1. Главная
  2. Библиотека
  3. Теория вероятностей
  4. У вас есть данные о классификации фотографий ИИ-моделью...
Разбор задачи

У вас есть данные о классификации фотографий ИИ-моделью. Для каждой фотографии дано два значения: • si — числовая уверенность модели, чем больше si, тем больше уверенность, что на изображении кот; • yi — истинная метка (1 — кот, 0 — собака). Модель не

  • Предмет: Теория вероятностей
  • Автор: Кэмп
  • #Теория вероятностей и математическая статистика
  • #Математическая статистика
У вас есть данные о классификации фотографий ИИ-моделью. Для каждой фотографии дано два значения: • si — числовая уверенность модели, чем больше si, тем больше уверенность, что на изображении кот; • yi — истинная метка (1 — кот, 0 — собака). Модель не

Условие:

У вас есть данные о классификации фотографий ИИ-моделью. Для каждой фотографии дано два значения:
• si — числовая уверенность модели, чем больше si, тем больше уверенность, что на изображении кот;
• yi — истинная метка (1 — кот, 0 — собака).
Модель не знает yi. Нужно выбрать одно пороговое значение T. Тогда предсказание модели определяется так:
Если si ≥ T → модель предсказывает 1 (кот).
Если si < T → модель предсказывает 0 (собака).
Требуется подобрать порог T так, чтобы общее число ошибок (неправильно классифицированных объектов) было минимальным.
Если для нескольких T число ошибок одинаково, выбрать наименьшее T.
Формат входных данных:
Первая строка — n (количество картинок). Далее n строк вида: si yi
Числа si отсортированы по возрастанию.
Вывести: два числа — минимальное число ошибок и соответствующий наименьший порог T.

Решение:

Шаг 1: Понимание условия

У нас есть отсортированные по возрастанию sis_i (уверенность модели, что на фото кот).
Истинная метка yi{0,1}y_i \in \{0, 1\}, где 1 — кот, 0 — собака.

Порог TT:

  • если siTs_i \ge T → предсказываем 1 (кот)
  • если si<Ts_i < T → предсказываем 0 (собака)

Ошибки:

  1. Истина 0 (yi=0y_i = 0), а предсказание 1 (siTs_i \ge T) — ложноположительные (FP).
  2. Истина 1 (yi=1y_i = 1), а предсказание 0 (si<Ts_i < T) — ложноотрицательные (FN).

Общее число ошибок = FP + FN.


Шаг 2: Как считать ошибки для заданного T

Поскольку sis_i о...

Внутри — полный разбор, аргументация, алгоритм решения, частые ошибки и как отвечать на каверзные вопросы препода, если спросит

Попробуй решить по шагам

Попробуй один шаг и продолжи в режиме обучения или посмотри готовое решение

Какой подход является наиболее эффективным для определения оптимального порога T, минимизирующего количество ошибок классификации, учитывая, что значения уверенности модели (si) уже отсортированы?

Что нужно знать по теме:

Что нужно знать по теме

Алгоритм решения

Топ 3 ошибок

Что спросит препод

Выбери предмет