在使用 CNN 进行图像分割时,我们经常听到 Dice 系数,有时我们会看到术语 Dice Loss。我们很多人对这两个指标感到困惑。
在物理上它们是相同的,但是当我们查看它们的值时,我们会发现它们并不相同!
答案很简单,但是在说它们之间的区别之前,我们先来谈谈什么是 Dice 系数,因为 Dice Loss是Dice 系数的一个特例。
1.Dice 系数
例如,当我们进行语义分割时,我们希望在训练期间(即在验证步骤中)或在训练后(即在测试步骤中)评估模型。我们总是需要计算一个度量,它是Ground Truth(真实值)和 Predicted Mask(预测值)之间的等式。通过查看这些指标的值,我们可以说模型学习得好不好。因此,可以用作度量的Dice系数方程是Ground Truth(真实值)和Predicted Mask(预测值)之间的交集的两倍,除以Ground Truth(真实值)和Predicted Mask(预测值)之和。
让我们更清楚地说明一下:
圆圈 A 表示Ground Truth(真实值),圆圈 B 表示Predicted Mask(预测值)。
你可以看到这个黄色部分是Ground Truth(真实值)和Predicted Mask(预测值)之间的交集。
这将是Dice系数,所以随着交集的增加,Dice系数也在增加。
Dice系数可以取的最小值为 0,即Ground Truth(真实值)和Predicted Mask(预测值)之间没有交集。此时分子值 0,当然 0 除以任何值都会得到 0。
Dice系数可以取的最大值为 1,这意味着预测正确率为 100%。此时,我们将有等于 A 或 B(Ground Truth(真实值)或Predicted Mask(预测值))的交集,因为它们是相同的。让我在图表中向您展示这一点。
我希望你了解Dice系数的原理。由此我们可以知道Dice系数的值介于 0 和 1 之间,我们越接近 1 意味着模型预测的结果很好。
2.Dice Loss
现在你明白了 Dice 系数的含义,Dice Loss也很容易。您还记得我们说过Dice的最佳值是接近 1 的值,并且我们知道对于损失值,我们需要较小的值来校正反向传播中的权重。
所以我们可以使用 Dice 系数做一个小方程来得到小值而不是接近 1 的值。
通过查看这个等式,我们可以得出结论,当 dice 值上升时,dice loss 会下降,当我们得到 dice 的最大值时,损失值为 0,这意味着模型是完美的。