假设一个集合中有N篇文章
一个集合中有N(N-1)/2个集合对
TP:同一类的文章被分到同一个簇
TN:不同类的文章被分到不同簇
FP:不同类的文章被分到同一个簇
FN:同一类的文章被分到不同簇
Rand Index度量的正确的百分比
RI = (TP+TN)/(TP+FP+FN+TN)
因此,FP=40-20=20.
同理,
因此,TN=96-24=72.
| Same cluster | Different clusters |
Same class | TP=20 | FN=24 |
Different classes | FP=20 | TN=72 |
RI=(20+72)/(20+20+24+72)=0.68
Precision=TP/(TP+FP)
Recall=TP/(TP+FN)
F1=2×Recall×Precision/(Recall+Precision)
Precision=20/40=0.5
Recall=20/44=0.455
F1=(2*0.5*0.455)/(0.5+0.455)=0.48