Определение популярности тем сайта посредством анализа его обратных ссылок
13
сбалансированной F-мерой (balanced F measure) и вычисляется следующим образом:
Для вычисления единственного показателя, объединяющего показатели отдельных классификаторов, могут быть использованы два подхода:
- макроусреднение (macroaveraging), представляющее собой вычисление меры качества для каждого класса, а затем их среднего значения;
- микроусреднение (microaveraging), при котором объединяются все решения по всем классам, и затем вычисляется мера качества классификации.
В данной работе для оценки качества классификации используется микроусреднение, поскольку на результат макроусреднения сильно влияют классы с небольшим числом решений по ним [8], а для решения поставленной задачи гораздо важнее общая картина, чем количество верных решений для небольших классов.
Пусть C – количество классов в коллекции, тогда микроусреднённые меры вычисляются по формулам:
Точность:
Полнота: