前言
用Dice Loss的作语义二分类分割Loss的过程中,发现自己并不知道Dice是什么,计算公式是如何得到的?那么来探索一下。
一、Dice Loss是什么?
Dice loss是Fausto Milletari等人在V-net中提出的Loss function,其源于Sørensen–Dice coefficient,是Thorvald Sørensen和Lee Raymond Dice[^1]于1945年发展出的统计学指标(参考WiKi)。这种coefficient有很多別名,最响亮的就是F1 score。在了解Dice loss之前我们先谈谈Sørensen–Dice coefficient是什么。
1,Dice coefficient定义
Dice similarity coefficient (DSC)是用来测量两个样例的相似性,定义如下:
其中 |X∩Y| 是X和Y之间的交集,|X|和|Y|分表表示X和Y的元素的个数,其中,分子的系数为2是保证分母重复计算后取值范围在 [0-1] 之间
二分类问题中DSC 也可以被定义成如下形成:
但是上面这个公式是如何得到的呢?我们回顾一下DSC的其它叫法,比较常听到的是F1 score,看看它是如何定义。
2,F1 score定义
F1 score 定义是想以相同权重的调和平均整合precision和recall两个指标:
我们已经知道,精准率(指预测值与真实值的重合程度,区别于accuracy)和召回率定义如下:
precision和recall的定义又由下面关系给出:
真实值/预测值 | Positive | Negative |
---|---|---|
Positive | True Positive | False Negative |
Negative | False Positive | True Negative |
可以见F1 score等同于Dice coefficient,直观上dice coefficient是计算 X X X与