Определение популярности тем сайта посредством анализа его обратных ссылок
13

сбалансированной F-мерой (balanced F measure) и вычисляется следующим образом:
 

Для вычисления единственного показателя, объединяющего показатели отдельных классификаторов, могут быть использованы два подхода:

  • макроусреднение (macroaveraging), представляющее собой вычисление меры качества для каждого класса, а затем их среднего значения;
  • микроусреднение (microaveraging), при котором объединяются все решения по всем классам, и затем вычисляется мера качества классификации.

 

В данной работе для оценки качества классификации используется микроусреднение, поскольку на результат макроусреднения сильно влияют классы с небольшим числом решений по ним [8], а для решения поставленной  задачи гораздо важнее общая картина, чем количество верных решений для небольших классов.

Пусть C – количество классов в коллекции, тогда микроусреднённые меры вычисляются по формулам:

Точность:

Полнота: