【视频目标跟踪】Motion-Attentive Transition for Zero-Shot Video Object Segmentation 一览

最新推荐文章于 2023-10-19 23:59:10 发布

KirutoCode

最新推荐文章于 2023-10-19 23:59:10 发布

阅读量1.1k

点赞数 1

分类专栏： VOS

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/McEason/article/details/104840813

版权

Motion-Attentive Transition for Zero-Shot Video Object Segmentation

本文创新点\贡献
本文IDEA来源
方法
总结

本文创新点\贡献

本文IDEA来源

人类视觉，对动态物体比对静态物体更敏感，从生物学迁移

方法

在这里插入图片描述

方法概述

结构分三大块，编码器，桥型网络，解码器，方法是双流

核心是双流深度交错编码器，不仅继承了多模态特征的优势，还能转移中间motion注意力特征来促进外观学习

Interleaved Encoder Network

在这里插入图片描述

编码：
变换由多个MAT(Motion Attentive Transition )块组成，每个块都把输入图片和光流映射在卷积阶段的特征作为输入，在block的里边建立的不对称注意力机制，先推理基于光流的RoI，然后变换推理来为外观特性提供更好的选择性

双流结构，联合编码物体外观和移动

包含MAT，提供一个运动到外观的传递，使用ResNet-101的前五个卷积块作为每个流的backbone
给定RGB帧 $I_a$ 和他的光流映射 $I_m$ ，编码器提取中间特征 $V_{a,i} \in R^{W\times H \times C}$ 还有 $V_{m,i}\in R^{W\times H \times C}$ ， $i\in{2,3,4,5}$ 是残差块的序号(就是)，然后MAT块的操作：
$U_{a,i},U_{m,i} = F_{MAT}(V_{a,i},V_{m,i})$
其中 $U_{.,i}\in R^{W\times H \times C}$

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【视频目标跟踪】Motion-Attentive Transition for Zero-Shot Video Object Segmentation 一览

没看完
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。