【每周论文阅读-第五周】01 MANet：Fully Motion-Aware Network for Video Object Detectio

最新推荐文章于 2021-01-03 17:27:24 发布

呆军

最新推荐文章于 2021-01-03 17:27:24 发布

阅读量477

点赞数

分类专栏：论文阅读

本文链接：https://blog.csdn.net/m0_38065546/article/details/97617820

版权

MANet结合像素级和实例级校准，有效处理视频中目标的运动变化和遮挡问题。通过ECCV 2018发表的研究，作者提出了一种新的视频对象检测框架，利用光流估计和特征聚合提高检测准确性。

摘要由CSDN通过智能技术生成

MANet： Fully Motion-Aware Network for Video Object Detection

文章链接：http://openaccess.thecvf.com/content_ECCV_2018/papers/Shiyao_Wang_Fully_Motion-Aware_Network_ECCV_2018_paper.pdf
来源：ECCV 2018

在视频目标检测中，常用光流来估计前后帧的运动，并将其作为不同帧特征校准的参照，但是有些工作通过实验已经证明在帧间信息变化较快时（特别是目标被遮挡时），光流估计会失准。本文通过将实例级的特征校准与原来像素级的像素级特征校准（光流传播）结合用来准确的估计目标的运动变化。并且作者观察到像素级的特征校准对于目标的非刚性变化（例如，动物的姿态变化）效果很好，而实例级的特征校准对目标的刚性变化（例如，汽车的位移）效果很好，并且实例级特征校准对视频中的目标遮挡更加鲁棒。

方法

作者将推出的方法分为三部分：像素级特征校准，实例级特征校准，如何结合两种方法实现完全的运动估计
先上图
在这里插入图片描述

1 像素级校准

像素级校准就是通过对当前帧和相邻帧之间的运动估计，将相邻帧的特征聚合到当前帧，进一步优化当前帧的检测结果。具体而言对于当前帧 $\boldsymbol{I}_{t}$ ，和其相邻帧 $\boldsymbol{I}_{t-\tau}$ （或是 $\boldsymbol{I}_{t+\tau}$ ），通过特征提取器 $\mathcal{N}_{f e a t}$ 得到特征 $\boldsymbol{f}_{t-\tau}, \boldsymbol{f}_{t}$ ，我们想要将 $\boldsymbol{f}_{t-\tau}$ 聚合到 $\boldsymbol{f}_{t}$ 中：

通过FlowNet估计从 $\boldsymbol{I}_{t}$ 到 $\boldsymbol{I}_{t-\tau}$ 的光流场 $\mathcal{F}\left(\boldsymbol{I}_{t-\tau}, \boldsymbol{I}_{t}\right)$ 。
将光流场作为参照将 $\boldsymbol{f}_{t-\tau}$ 与 $\boldsymbol{f}_{t}$ 对齐，对于当前帧的某一位置 $\boldsymbol{p}$ 通过光流场可以得到其相对于相邻帧的位置变化 $\Delta p$ ，现在我们得到了当前帧 $\boldsymbol{p}$ 位置在相邻帧上的位置映射 $\boldsymbol{p}+\Delta \boldsymbol{p}$ 。之后用双线性插值 $G(\cdot)$ 将 $\boldsymbol{f}_{t-\tau}$ 对齐到 $\boldsymbol{f}_{t-\tau \rightarrow t}$ ，如下式。

$\begin{aligned} \Delta \boldsymbol{p} &=\mathcal{F}\left(\boldsymbol{I}_{t-\tau}, \boldsymbol{I}_{t}\right)(\boldsymbol{p}) \\ \boldsymbol{f}_{t-\tau \rightarrow t}(\boldsymbol{p}) &=\sum_{\boldsymbol{q}} G(\boldsymbol{q}, \boldsymbol{p}+\Delta \boldsymbol{p}) \boldsymbol{f}_{t-\tau}(\boldsymbol{q}) \end{aligned}$
$G(\boldsymbol{q}, \boldsymbol{p}+\Delta \boldsymbol{p})=\max (0,1-\|\boldsymbol{q}-(\boldsymbol{p}+\Delta \boldsymbol{p})\|)$
然后我们将当前帧的特征和相邻帧对齐后的特征聚合，与之前光流估计方法不同这里直接求各个特征的均值。

最低0.47元/天解锁文章

呆军

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【每周论文阅读-第五周】01 MANet：Fully Motion-Aware Network for Video Object Detectio

MANet： Fully Motion-Aware Network for Video Object Detection文章链接：http://openaccess.thecvf.com/content_ECCV_2018/papers/Shiyao_Wang_Fully_Motion-Aware_Network_ECCV_2018_paper.pdf来源：ECCV 2018在视频目标检测中...
复制链接

扫一扫

专栏目录