《Multi-Context Attention for Human Pose Estimation》

最新推荐文章于 2022-12-10 10:29:26 发布

gwpscut

最新推荐文章于 2022-12-10 10:29:26 发布

阅读量501

点赞数

本文链接：https://blog.csdn.net/gwplovekimi/article/details/90750504

版权

卷积神经网络专栏收录该内容

65 篇文章 6 订阅

订阅专栏

本文提出多语义attention机制。采用堆叠的hourglass networks来产生不同分辨率不同语义的特征下的attention map，而CRF（Conditional Random Field）用于对attention map里面的相邻的区域进行建模。进一步地，作者结合holistic （整体） attention model（关注于整个人体的一致性）以及body part attention model（关注人体不同部分的细节）。因此我们的模型可以focus在从局部显著区域到全局语义一致空间的粒度不同（different granularity from local salient regions to global semantic consistent spaces）。此外，我们涉及一个全新的Hourglass Residual Units (HRUs)来增加网络的感受野。

larger context region captures global spatial configurations of object, while smaller context region focuses on local part appearance（较大的上下文区域捕获对象的全局空间配置，较小的上下文区域关注局部零件外观）

设计了一个新的基于Conditional Random Fields的attention model

The combination of multiple contextual information has been proved effective for various vision tasks

采用stacked hourglass network structure来提供一个合适得结构去建立multi-context attention model