An Attention-Guided Deep Regression Model for Landmark Detection in Cephalograms阅读笔记

最新推荐文章于 2023-11-04 16:00:55 发布

Nightmare004

最新推荐文章于 2023-11-04 16:00:55 发布

阅读量145

点赞数

分类专栏：深度学习文章标签：深度学习关键点检测

本文链接：https://blog.csdn.net/qq_39942341/article/details/130088610

版权

深度学习专栏收录该内容

50 篇文章 2 订阅

订阅专栏

该框架采用两阶段方法进行地标检测，首先全局阶段的UNet生成粗略注意力，然后局部阶段利用全局阶段的heatmap裁剪图像进行精细化检测。在推理阶段，通过ExpansiveExploration策略扩大搜索区域以提高准确性。损失函数结合了交叉熵和focalloss，优化了训练过程。

摘要由CSDN通过智能技术生成

摘要

作者结合局部信息+全局的信息
作者提供的框架是一个两阶段的UNet
全局阶段：普通的UNet，
局部阶段：利用全局阶段生成的heatmap，裁剪patch送入局部阶段
在推理阶段，使用Expansive Exploration strategy

方法

模型分为局部阶段和全局阶段
全局阶段：普通的UNet,生成粗的注意力
局部阶段，利用全局阶段得到的landmark坐标，以坐标为中心裁剪patch，送进局部UNet
在这里插入图片描述

Expansive Exploration

推理阶段：
虽然粗的注意力大部分情况下比较准确，但是不能保证找到所有的landmark
所以这里用Expansive Exploration，其实就是扩大了搜索区域
在这里插入图片描述

heatmap

除了19个landmark，还增加了一个背景类别
$H^i(x, y)= \begin{cases}\exp \left[-\frac{1}{2 \sigma^2}\left(\left(x-x_i\right)^2+\left(y-y_i\right)^2\right)\right], & i=1,2, \ldots, 19 \\ 1-\sum_{j=1}^{19} H^j(x, y), & i=20\end{cases}$

loss

交叉熵+focal loss
$\begin{gathered} L(H, \widehat{H})=-\frac{1}{N} \sum_{b=1}^N\left(\frac{1}{2} \cdot H \cdot \log \widehat{H}+\frac{1}{2} \cdot \alpha_t \cdot\left(1-H_t\right)^\gamma \cdot \log H_t\right), \\ \text { where } H_t=\left\{\begin{array}{cc} \widehat{H} & \text { if } H>0.01 \\ 1-\widehat{H} & \text { otherwise } \end{array}\right. \end{gathered}$