《Multi-Context Attention for Human Pose Estimation》

本文提出多语义attention机制。采用堆叠的hourglass networks来产生不同分辨率不同语义的特征下的attention map,而CRF(Conditional Random Field)用于对attention map里面的相邻的区域进行建模。进一步地,作者结合holistic (整体) attention model(关注于整个人体的一致性)以及body part attention model(关注人体不同部分的细节)。因此我们的模型可以focus在从局部显著区域到全局语义一致空间的粒度不同(different granularity from local salient regions to global semantic consistent spaces)。此外,我们涉及一个全新的Hourglass Residual Units (HRUs)来增加网络的感受野。

 

larger context region captures global spatial configurations of object, while smaller context region focuses on local part appearance(较大的上下文区域捕获对象的全局空间配置,较小的上下文区域关注局部零件外观)

 

设计了一个新的基于Conditional Random Fields的attention model

The combination of multiple contextual information has been proved effective for various vision tasks

采用stacked hourglass network structure来提供一个合适得结构去建立multi-context attention model

 

Hourglass Residual Units (HRUs)

HRUs as a replacement for the residual unit 它融合了多尺度特征的表现力,同时保留了residual learning的好处。同时也让深得网络具备一个更快增长得感受野。

关于Hourglass 网络https://blog.csdn.net/u013841196/article/details/81048237

https://blog.csdn.net/qq_38522972/article/details/82958077

网络结构如下图所示

Nested Hourglass Networks, 将residual单元(沿着分支,用于组合多个分辨率的功能)用所提出的HRUs来代替。如图3所示。采用这个结构,我们丰富了每个建立的block输出的信息,也使得网络对于尺度更加鲁棒。

Multi-Resolution Attention

在每一个hourglass,多分辨率的attention map由不同尺度的feature产生,如图5所示。attention map之后再结合到一起,生成细化特征。进一步用于生成精细的注意力地图和进一步精细的特征。如图4所示。

 

 

 

参考材料

关于attention(https://blog.csdn.net/wuzqchom/article/details/75792501

https://blog.csdn.net/yideqianfenzhiyi/article/details/79422857

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值