Условие:
Перед вами стоит задача разделить данные на кластеры так, чтобы внутри каждого кластера объекты были максимально похожими. Какую метрику для оценки качества проведённой кластеризации вы будете использовать?
Индекс Рэнда (Rand)
V-мера (V-measure)
Полнота (completeness)
Однородность (homogeneity)
Решение:
Рассуждение: 1. Нам дана задача группировки объектов так, чтобы объекты внутри одного кластера были максимально похожи друг на друга. Это означает, что внутри каждого кластера должна быть высокая степень однородности. 2. Индекс Рэнда (Rand) оценивает сходство между двумя разбиениями данных, но он не фокусир...
