【每周论文阅读-第四周】proposal-level 特征聚合视频目标检测方法02

上篇文章链接:https://blog.csdn.net/m0_38065546/article/details/96710698

2 Sequence Level Semantics Aggregation for Video Object Detection

文章链接:https://arxiv.org/abs/1907.06390v1

方法

这篇文章总体思路其实和上篇文章差不多的,主要有以下几个不同
1、本文中没有只聚合同一个类的proposal,而不是全部proposal
2、没有考虑proposal间的位置信息
3、作者将其提出的方法与谱聚类方法进行了类比,将视频目标检测定义为muti-shot问题,而不是时间序列问题,将视频检测与时序解耦。
4、采样帧数不再局限于3帧,而是聚合多个帧的proposal特征到一个关键帧proposal,这也是为什么题目中说是序列级聚合,其实聚合的还是proposal。
具体来看,如下图:
对于关键帧上的某个proposal,聚合来自其他帧中的同类proposal。
在这里插入图片描述

如何评判两个proposal同属一个类别?

在这里作者用余弦相似度来判断两个proposal是否来自同一个类别:
对于一对proposal ( x i k , x j l ) \left(\mathbf{x}_{i}^{k}, \mathbf{x}_{j}^{l}\right) (xik,xjl)它们之间的相似性 w i j k l

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值