Regressing Heatmaps for Multiple Landmark Localization Using CNNs阅读笔记

最新推荐文章于 2023-04-11 13:02:55 发布

Nightmare004

最新推荐文章于 2023-04-11 13:02:55 发布

阅读量350

点赞数

分类专栏：深度学习文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/qq_39942341/article/details/130043055

版权

深度学习专栏收录该内容

50 篇文章 2 订阅

订阅专栏

最早在医学landmark detection里用heatmap的
代码：https://github.com/christianpayer/MedicalDataAugmentationTool-HeatmapRegression
这里的代码是他们之后medical image anaylsis的
~~tf的看着挺难受的~~

摘要

作者使用了heatmap来进行landmark detection
提出了SpatialConfiguration-Net（SCN），将局部heatmap和全局空间信息结合

引言

为了能解决假阳性问题，最新（2016）的做法是局部特征+全局landmark空间信息

Heatmap Regression Using CNNs

这里用高斯heatmap，每个landmark对应一个heatmap，最后通过取最大值得到landmark坐标
在这里插入图片描述

Downsampling-Net

交替使用卷积和下采样
缺点：得到的heatmap分辨率低，因此结果不准确

ConvOnly-Net

只使用卷积
但是这里不用步长>1的卷积，也不用池化，因此可能需要更大的卷积核才能达到前面Downsampling-Net的感受野

Unet

与原版Unet相比，将最大池化换成平均池化，将反卷积换成上采样

SCN

首先通过3层卷积，得到每个landmark $L_i$ 的局部的heatmap $\mathbf{H}_i^{app}$
尽管局部的heatmap非常准确，但是他们可能分不出来一些相似的点，例如指尖
（如下图，理想情况肯定是只有一个亮的地方）
在这里插入图片描述
作者想要通过结合其他的landmark，来消除这种相似

作用通过较大的卷积核 $K_{i,j}$ 来学习 $L_i$ 的相对 $L_j$ 的位置，将 $H_j^{app}$ 通过 $K_{i,j}$ 变成 $H_{i,j}^{trans}$ ，即
$H_{i,j}^{trans} = H_j^{app} *K_{i,j}$
其中 $*$ 表示卷积

之后将 $H_{i,j}^{trans}$ 相加
$H_i^{acc} = \sum_{j=1}^{n}H_{i,j}^{trans}$
最后按元素乘，得到最终的heatmap：
$H_i = H_i^{app} \odot H_i^{acc}$

在这里插入图片描述
spatial configuration block在一个较低的分辨率上进行，因为只需要相对位置信息，不需要太高的分辨率
最后在按元素乘之前会上采样，保证分辨率一样

实验

数据集

作者采用了一个2d的和一个3d的数据集
2d：895张平均尺寸 $1563\times 2169$ 的图，37个landmark，假设手腕 $50 mm$
3d：60张MR T1， $294 \times 512 \times 72$ ，28个landmark， $0.45 \times 0.45 \times 0.9 mm^3$

模型

ConvOnly-Net

6个卷积层，卷积核大小（2d： $11\times 11$ , 3d： $\times 5 \times 5$ )

Downsampling-Net

两次卷积+一次池化，最后一个模块后面又两个额外的卷积层
2d： $5\times 5$ 卷积核，2个下采样模块
3d： $3\times 3 \times 3$ 卷积核，层下采样

UNet

2d： $3\times 3$ 卷积，4层下采样
3d： $3\times 3\times 3$ 卷积，3层下采样

SCN

2d：前面3层卷积是 $5\times 5$ 的，后面是 $15\times 15$ 卷积以及8倍下采样（应该是spatial configuration block之前下采样）
3d：前面3层卷积是 $3\times 3\times 3$ 的，后面是9\times 9\times 5$卷积以及4倍下采样