【论文阅读】Learning Deep Structured Multi-Scale Features using Attention-Gated CRFs（2017）

最新推荐文章于 2023-12-22 11:17:23 发布

Jiazhou_garland

最新推荐文章于 2023-12-22 11:17:23 发布

阅读量525

点赞数

分类专栏：边缘检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43019433/article/details/118227779

版权

cXu, D., Ouyang, W., Alameda-Pineda, X., Ricci, E., Wang, X., & Sebe, N. (2018). Learning deep structured multi-scale features using attention-gated crfs for contour prediction. arXiv preprint arXiv:1801.00524.
原文链接
 原文代码

文章目录

摘要
1. 介绍
2. 模型
- 2.1 问题定义与符号说明
- 2.2 Implementation with neural network for joint learning
3.结果

摘要

一个SOTA的模型在多尺度特征提取和融合方面优于过往模型；不同与既往模型直接利用网络每层输出特征图作为多尺度特征，此模型采用分层次的深层网络产生更加丰富与互补的特征表达；其次，利用注意力门限-条件随机场Attention-Gated Conditional Random Fields (AG-CRFs)进行模型融合。
SOTA结果在数据集BSDS500 and NYUDv2上。

1. 介绍

此工作motivation在于这样一个问题：

is it worth modeling and exploiting complex relationships between multiple scales of a deep representation for contour detection?

简言之就是探究对不同尺度特征图进行更为复杂的建模实现融合是否对于轮廓提取很重要？

本文作者探究得到的结果是肯定的。

作者受当时图神经网络的启发，加入了attention机制，提出了Attention-guided Multi-scale Hierarchical deepNet (AMH-Net) 网络能够更好的进行特征提取，并利用 AG-CRF进行特征融合增强特征表现力。

2. 模型

2.1 问题定义与符号说明

在这里插入图片描述

$F = {\{f_{s}\}_{s=1}^S}$ 表示S个尺度特征集合
$f_{s} = {\{f_{s}^i\}_{i=1}^N}$ 表示在像素 $i$ 处的向量集合，其中 $N$ 表示像素总数量
$h_{s} = {\{h_{s}^i\}_{i=1}^N}$ 表示利用 $f_{s}$ 学习到的用于多尺度特征融合的下一级特征图

因为上一尺度对应像素点的信息不一定对映与下一尺度，因为设置门（gate）的概念来刻画这种对应关系，限制信息的流动。

${g_{s_{e},s_{r}}^i \in \{0,1\}}$

最低0.47元/天解锁文章

Jiazhou_garland

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。