对Dice loss的理解
Dice loss适用于图像的二值分割,且一定程度上能缓解正负样本在数量上不平衡的问题。相比的其它的代价函数,Dice loss显得非常的抽象,所以本文将解释Dice loss为什么能够解决正负样本不平衡的问题。
论文原文:V-Net: Fully Convolutional Neural Networks for Volumetric Medical Image Segmentation
Dice loss的表达式为:
其中 y i \rm{y}_{\rm{i}} yi与 y ^ i \rm{\hat y}_{\rm{i}} y^i分别是像素 i {\rm{i}} i的标签值与预测值。 N {\rm{N}} N为像素点的总数,为单张图片像素的数量乘上batch size。可见Dice loss是一种区域性的代价函数,即网络的全部输出都会影响像素 i {\rm{i}} i处的网络梯度。
假设 i = 1 {\rm{i = 1}} i=1,我们对该处像素的输出值求偏导(梯度)可得:
可见,若 y 1 = 0 \rm{y}_{\rm{1}}=0 y1=0,则该像素点梯度为正,则网络会向 y ^ 1 = 0 \rm{\hat y}_{\rm{1}}=0 y^1=0的方向进行优化;若 y 1 = 1 \rm{y}_{\rm{1}}=1 y1=1,则该