端到端训练 联合训练_开源 | CVPR2020 端到端的ZSL训练模型,用于视频分类任务...

本文首发于公众号:CNNer 。每日分享CVPR、ECCV等会议,关注深度学习、自动驾驶领域,我们期待你的加入。关注“CNNer”,选择加“星标”或“置顶”精选干货,当日达。

论文地址:http://arxiv.org/pdf/2003.01455v3.pdf

代码:https://github.com/bbrattoli/zeroshotvideoclassification.

来源:海德堡大学

论文名称:Rethinking Zero-shot Video Classification: End-to-end Training for RealisticApplications

原文作者:Biagio Brattoli

经过大型数据集的训练,深度学习(DL)可以准确地将视频分类为数百个不同的类。但是,对视频数据进行标注的代价非常高。为此Zero-shot learning (ZSL)训练一个模型,提出了一种解决方案。ZSL算法只需要训练一次就可以在新的任务中有很好的的表现,这大大增加了模型的泛化能力。为此,本文第一次提出了基于端到端分类算法的ZSL模型应用于视频分类中。本文模型在最近的视频分类文献的基础上,建立训练程序,使用3DCNN来训练学习视觉特征。本文方案还扩展了当前的基准测试范例,使得测试任务在训练时未知,这是以往技术达不到的。该模型支持通过训练和测试数据实现域的转变,而不允许将ZSL模型分割为特定的测试数据集。本文提出的模型易于理解和扩展,而且训练和评估方案很容易与其他方法结合使用,同时性能远远超过现有方法。

下面是论文具体框架结构以及实验结果:

9202d718884334ed8f4ac689ec597da3.png
2b78e588a2116671e67f0d37516231d9.png
eb427e3668c2378ee2c0c14817857d5c.png
bb6f2a381d7e2ff5bc5518396d4f5271.png
f078985793fafbb57e9816a1219946d4.png
08faac15de32cef37b557cac6f95f982.png
92c07b5fe450df4b5902ad83b3a37caa.png
1fd67215e880cf74634135c4825f3c96.png
b738f32481cde3d383be4741a21bc693.png
2ce1fd9efdbb26466a399683983b8b69.png

备注:研究方向+地点+学校/公司+昵称,更快通过申请,长按加细分领域技术交流群:

0fb9c3e302aca1b16b05056d9a475550.png

声明:

文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请联系删除,长按加微信▲

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值