3D Segmentation with Exponential LogarithmicLoss for Highly Unbalanced Object Sizes-MICCAI2018【论文理解】

最新推荐文章于 2024-10-18 18:00:50 发布

chestnut--

最新推荐文章于 2024-10-18 18:00:50 发布

阅读量2.5k

点赞数 3

分类专栏：深度学习笔记文章标签：小目标图像分类 loss function 医疗影像分割

本文链接：https://blog.csdn.net/m0_37477175/article/details/85335415

版权

深度学习笔记专栏收录该内容

51 篇文章

订阅专栏

MICCAI 2018的论文
在这里插入图片描述

前言

深度学习的迅速发展，使得在医疗影像分割上也有很多深度学习模型。但是论文提出，大部分的网络只能处理数量较少的类别（<10），并且在3D影像分割中，很难处理小目标，解决数据极度不均衡的问题。本论文提出了新的3D网络网络结构和新的loss function。这个loss function是收到了focal loss的启发，称为指数对数损失函数(Exponential Logarithmic loss)，可以通过不同标签的样本数量的相对大小，以及他们的分割难度来平衡各个标签。论文使用20个标签的脑分割图像，达到了DICE 82%，其中最大最小标签之间的大小比例是0.14%。训练不需要100个epoch便可以达到这个精度。
区域大小和Dice分数之间的相关性：
在使用DICE loss时，对小目标是十分不利的，因为小目标一旦有部分像素预测错误，那么就会导致DICE大幅度的下降。
先看一下GDL(the generalized Dice loss)，公式如下(标签数量为2)：
$2\frac{\sum_{l=1}^{2}w_l\sum_nr_{ln}p_{ln}}{\sum_{l=1}^{2}w_l\sum_nr_{ln} + p_{ln}}$
其中 $r_{ln}$ 为类别l在第n个像素的标准值(GT)，而 $p_{ln}$ 为相应的预测概率值。此处最关键的是 $w_l$ ，为每个类别的权重。其中 $w_l = \frac{1}{(\sum_{n=1}^{N}r_{ln})^2}$ ，直观的感觉就是将得到的DICE值除以每个label的所有的真值，说白了就是进行了均衡化的操作，将大物体和小物体放到同一水平上再进行对比。
打个比方吧，一立方米棉花和一立方分米的铁，分别切掉相同大小的东西，要比较对那个物体的影响最大，质量丢失的最多。如果直接比较切下来的部分那么：
$切下的棉花 < < 切下的铁$
这对棉花不公平，那么改进为：
$\frac{切下的棉花} {所有的棉花} 与 \frac{切下的铁} {所有的铁}$
相比较，归一化到同一水平下，就可以同时兼顾大物体和小物体。
但是此篇论文觉得而且这种情况跟不同标签之间的相对尺寸无关，但是可以通过标签频率来进行平衡。
值得实验探究～～～

Exponential Logarithmic loss

结合了focal loss以及Dice loss。此loss的公式如下：
$L_{EXP} = w_{dice}*L_{Dice} + w_{Cross}*L_{Cross}$ ,此时新增添了两个参数权重分别是 $w_{Dice}$ 和 $w_{Cross}$ ，而 $L_{Dice}$ 为指数log Dice损失(the exponential logarithmic Dice loss)， $L_{Cross}$ 为指数交叉熵损失。
$L_{Dice} = E[(-ln({Dice}_i))^{\gamma_{Dice}}]$ ，其中 $Dice_i = \frac{２(\sum_x\delta_{il}(x)p_i(x)) + \epsilon}{(\sum_x\delta_{il}(x) + p_i(x) ) + \epsilon}$ ， $L_{Cross} = E[w_l(-ln(p_l(x)))^{r_{Cross}}]$ ，x为体素的位置，i为label，l为在位置x的ground-truth。 $p_i(x)$ 为softmax之后的概率值。其中 $w_l = (\frac{\sum_kf_k}{f_l})^{0.5}$ ， $f_k$ 为标签k的出现频率，这个参数可以减小出现频率较高的类别权重。 $\gamma^{Dice}$ 和 $\gamma^{Cross}$ ，提升非线性的作用，如下图显示的是不同的指数log非线性表现：
在这里插入图片描述