【视频显著性检测】Revisiting Video Saliency: A Large-scale Benchmark and a New Model【论文笔记】

本文介绍了针对视频显著性检测的研究进展,包括建立一个包含丰富场景的大型数据集,以及提出结合注意力机制的CNN-LSTM网络模型。数据集由17名观察者标注的1k份视频组成,确保了自由观看的显著性检测。网络模型利用VGG-16和Attention Model捕捉帧间信息,并通过ConvLSTM进行记忆和平滑转移。此外,论文探讨了数据集的中心偏差、多样化的损失函数和注意力模块的设计策略。
摘要由CSDN通过智能技术生成

论文链接

该论文主要内容有两点:

一、建立了包含场景更加丰富的数据集,

二、提出了一个结合注意力机制的CNN-LSTM网络,作为视频显著性检测模型。

 

数据集:已有的一些数据集,要么数量太少,要么场景单一,且annotation获取时是由任务驱使的不是自由观看的。【显著性检测的是free view时人眼的凝视点】。我们建立了一个场景更加丰富的数据集,共1k份视频,由17名观察者标注完成。

网络模型:网络结构如图,每一帧图片输入到VGG-16【去掉全连接】的网络中,然后一段接Attention Model,另一端直接连接,,输出如左图,将注意力模块的输出与原输出相加,以保证不丢失有用的信息,从而得到每一帧的动态特征图。将每一帧的动态特征图输入到ConvLSTM中,通过记忆之前帧的显著性图像,指导当前帧的显著性图像,从而保证帧间的注视点平滑转移。

有意思的点&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值