dice 指标的原名是 Sørensen–Dice coefficient
下面是一段关于它的介绍
dice 指标也用在机器学习当中,他的表达方式如下:
有的朋友可能会发现, 这与机器学习中的评价指标 F1 是相同的, 没错,
F1 指标就是 Sørensen–Dice coefficient 的一种别名。
我们从机器学习的角度来探索一下这个指标的表达式。
label \ predicted | True | False |
True | TP | FN |
False | FP | TN |
我们以 TP 为例来讲一下上面的表格,
个人意见,
TP(True Positive真正例) FN(False Negative假反例) FP(False Positive 假正例) TN (True Negative真反例)
这四个指标全部是针对于预测结果的 。
具体的意思就是:
所谓真正例 TP, 是指你预测的结果为正例 ,并且预测对了(真)。其实我觉得如果叫 ‘ 正例真 ‘ 可能更容易理解一些。
以此类推, FN 译为 假反例 ,或者叫 反例假 ; 就是你的预测结果为反例,但却是个错误的结果 (假)。
然后 在机器学习的分类问题当中, 我们定义了如下的两个计算指标
(1) 查准率 precison
从上面的公式我们可以看出, 查准率所表达的是 预测对的正例 占 预测出的所有正例样本(预测对+ 预测错) 的百分比
(2) 查全率 recall
查全率表达的则是 预测对的正例 占 预测对的所有样本(包含正确预测正例 和 正确预测反例) 的百分比
F1 则是基于 查准率 与 查全率 的调和平均值 (所谓的调和平均值也称倒数平均值)。
即
将 P 与 R 的表达式是带入上式, 我们就可以得到 F1 基于 上面表格的表达式
OK 现在让我们将上面的两部分 合二为一 ,
给出一种 Sørensen–Dice coefficient的常见表现方式 :
QS是Quotient of Similarity(相似商),就是coefficient的值,只会介于0~1。Image segmentation中,模型分割出的mask就是影像的挑选总数,专家标记的mask就是正确总数。对应到公式便可知挑选总数(TP+FP)和正确总数(TP+FN)分別就是X和Y,交集便是TP,可見Dice coefficient等同F1 score,直观上是计算X与Y的相似性,本质上则同时隐含Precision和Recall两个指标。
(参考自 : https://www.jianshu.com/p/0998e6560288)
dice 指标也是医学图像中的常见指标, 常用于评价图像分割算法的好坏。
从公式上来做直观的理解,如下图,其代表的是两个体相交的面积占总面积的比值,完美分割该值为1.。