论文阅读笔记
文章平均质量分 69
哈士奇的布偶
今天也要加油鸭:)
展开
-
【论文阅读笔记】Large-scale Video Classification with Convolutional Neural Networks
论文贡献: 1.采用多种方法扩展CNN到视频识别,并用Sports-1M数据集进行验证和测试。2.提出了将输入处理为低分辨率流和高分辨率流的方法,在不影响精确度的前提下显著减少了CNN的训练时间。3.验证模型能够扩展到UCF101数据集上,且显著提升了精确率。 时间信息融合模型: a)单帧模型(Single-frame):用于得到静态图像对视频分类的贡献。CNN结构:C(...原创 2018-09-05 16:21:59 · 2745 阅读 · 0 评论 -
【论文阅读笔记】Beyond Short Snippets: Deep Networks for Video Classification
主要目的: 视频分类 测试数据集: Sports-1M、UCF-101 方法概况: 使用在imageNet上预训练过的CNN(AlexNet或者GoogleLeNet)提取帧级特征,再将帧级特征和提取到的光流特征输入到池化框架或者LSTM进行训练,得到分类结果。 主要贡献: 1.提出采用CNN来得到视频级的全局描述,并且证明增大帧数能够显著提高分类性能。2...原创 2018-09-03 13:26:12 · 3562 阅读 · 0 评论 -
【论文阅读笔记】Learning Spatiotemporal Features with 3D Convolutional Networks
论文主要贡献:1.验证了3D卷积神经网络能够同时捕捉外观和运动信息,是优秀的特征提取器。2.在特定的构架内,3X3X3的卷积核在所有层中都表现出最好的效果。3.3D卷积神经网络提取出的特征结合线性模型分类器所得到的结果在6个数据集(4个识别任务)中都有突出的性能。好的视频特征描述应该包含如下特征:a)具有通用性,对任意类型的视频都能够有好的描述效果。b)特征足够紧凑,紧...原创 2018-09-06 16:00:58 · 721 阅读 · 0 评论 -
【论文阅读笔记】Visual Sentiment Prediction Based on AutomaticDiscovery of Affective Regions
主题:视觉情感分析贡献:a)提出了一个深度框架,用于自动发现图像的情感区域,这些区域很可能会引发重要的情绪信息。该框架不依赖于图像中的对象类别,也不需要对边界框注释,比现有方法更加通用。b)使用CNN构建视觉情感预测模型,该模型利用来自全局图像和局部图像区域的整体和局部信息。实验证明,最终得到的表达特征有助于视觉情感分类,在情感数据集的表现优于前人的方法。c)实验结果表明,本文提出...原创 2018-09-10 15:21:36 · 845 阅读 · 2 评论 -
【论文阅读笔记】Two-Stream Convolutional Networksfor Action Recognition in Videos
主题:行为识别摘要:本篇文章提出了使用深度学习进行视频人物的行为识别,结合了静止画面和帧间的运动信息。所做的贡献主要有三:1.提出了双流CNN来合并时间和空间网络;2.证明l了在训练数据有限的情况下,经过多帧密集光流训练的CNN依然能够实现非常好的性能;3.证明了应用于两个不同数据集的多任务训练可以增加数据量且提升网络在两个数据集上的分类性能。 光流特征表示方式:...原创 2018-09-26 11:05:58 · 335 阅读 · 0 评论 -
【论文阅读笔记】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks
代码地址:https://github.com/ZhaofanQiu/pseudo-3d-residual-networks主要贡献:以经济且有效的方式构建了仿3D卷积神经网络模型:P3D ResNet出发点:3D 卷积神经网络能够同时学习到视频的时间和空间特征,但是存在所需内存大和计算成本高的问题,导致难以构建更深层的3D CNN,因此提出了用二维空间卷积和一维时间卷积来模拟3D卷积的想...原创 2018-10-16 19:05:03 · 2366 阅读 · 0 评论