Large-scale Video Classification with Convolutional Neural Networks

本文探讨了如何在卷积神经网络中融合时间信息以实现大规模视频分类,详细介绍了单帧、早期融合、晚期融合和慢融合等方法。
摘要由CSDN通过智能技术生成

1. Introduction

       图像和视频在互联网上变得无所不在,这鼓励了开发可以分析其语义内容的不同应用程序的算法,包括搜索和摘要。近来,卷积神经网络(CNN)[15]已经被证明是一种有效的模型,用于理解图像内容,为图像识别,分割,检测和检索提供了最先进的结果[11,3,2, 20,9,18]。这些结果背后的关键因素是将网络扩展到数千万个参数和可以支持学习过程的大量标签数据集的技术。在这些条件下,CNN已被证明学习有力而可解释的图像特征[28]。在图像领域的积极成果的鼓舞下,我们研究了大规模视频分类中CNN的性能,网络具有不仅处理存在于单个静态图像中的外观信息,而且其复杂的时间演变。在这种情况下扩展和应用CNN有几个挑战。
       从实际的角度来看,目前没有匹配现有图像数据集的规模和多样性的视频分类基准,因为视频显然难以收集,注释和存储。为了获得足够的数据来训练我们的CNN架构,我们收集了一个新的Sports-1M数据集,其中包含一百五十万个YouTube视频,分类为487个运动类别。我们让Sport一1M可用于研究界,以支持今后在这方面的工作。

       从建模的角度来看,我们有兴趣回答以下问题:CNN架构中的什么时间连接模式最适合利用视频中存在的局部运动信息?附加运动信息如何影响CNN的预测,以及整体性能提高多少?我们通过评估多个CNN架构来经验地检查这些问题,每个CNN架构采用不同的方法来整合整个时间域的信息。
       从计算角度来说,CNN需要大量的训练时间来有效地优化参数化模型的数百万个参数。由于网络必须一次处理不是一个图像而是处理多个视频帧,所以在及时扩展架构的连接性时,会更加复杂。为了减轻这个问题,我们表明,加速CNN的运行性能的有效方法是修改架构以包含两个单独的处理流:在低分辨率帧学习特征的context流,和仅在帧的中间部分操作的高分辨率fovea流。由于输入的维度降低,我们观察到网络的运行性能增加了2-4倍,同时保持分类精度
       最后,出现的一个自然而然的问题是,在Sport-1M数据集上
很抱歉,根据提供的引用内容,我无法提供关于"SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS"代码的信息。引用的内容主要介绍了图上结点分类的半监督问题以及相关的研究方法和改进。如果您需要获取该代码,建议您查阅相关的学术论文或者在开源代码平台上搜索相关的项目。 #### 引用[.reference_title] - *1* [Semi-supervised classification with graph convolutional networks](https://blog.csdn.net/weixin_41362649/article/details/113232898)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [Kipf-GCN《Semi-Supervised Classification With Graph Convolutional Networks》论文详解](https://blog.csdn.net/u012762410/article/details/127177181)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Semi-Supervised Classification with Graph Convolutional Networks](https://blog.csdn.net/m0_37924639/article/details/124884547)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值