分割和检测的预测结果其实就是个与输入图像大小一致掩码(mask),用于表示每个像素所属类别。
1. DICE score
既能用于评估分割,也能用于评估检测,因为某种程度上,分割的精确度与检测相关。
DICE score属于F1 score,是精确率和召回率的调和平均数。这个分数基本上是像素级的检测得分。当应用于二元分割任务时,它会评估预测值A和真实值B之间的重叠程度,计算公式:
,取值范围为[0,1],值越大表示分割结果越好。
该指标有个缺点:当将该值用作loss训练网络时,会对分割错误的结果(假阳性和假阴性)进行惩罚,该惩罚依赖于假阴性部分(实际为真,预测为假)相对于其他预测部分和真实值的大小,当要分割的目标较小,如血管小分支、肺结节,会造成惩罚力度不够,导致分割效果不