TverskyLoss提出的初衷是为了解决数据的类不平衡现象的,其在精度和召回率之间取得了较好的平衡
精度:预测正确的数量/所有的数量
召回率:预测正确的数量/所有正确的数量
如果不平衡标签,学习过程可能会收敛到次优损失函数的局部极小值,因此预测可能会强烈偏向非损伤组织。结果将是高精度、低召回率的分割
解决数据不平衡的一种常用方法,特别是体素方法,是从每个类中提取相等的训练样本。这种方法的缺点是它没有使用图像的所有信息内容,并且可能偏向于很少的类
Dice Loss是precision和recall的调和平均值,对FPs和FNs的权重相等。为了更好地权衡精确性和召回率(FPs与FNs),我们提出了基于Tversky相似性指数的损失层。Tversky指数是骰子相似系数和Fβ得分的推广。下面介绍如何调整这个损失函数的超参数,以便在训练一个高度不平衡的数据中表现良好的网络时将重点放在假阴性。
方法
设P和G分别是预测值和真实值Ground truth值的集合,则Dice相似度系数表示为:
上面这个式子中的FPS(精确率)和FNs(召回率)的权重是相同的,为了使得在训练过程中召回率的权重高于精确率,基于Tversk