Papers
文章平均质量分 61
小胖蹄儿
这个作者很懒,什么都没留下…
展开
-
视频分类/动作识别数据库研究现状
主要参考论文:A survey on deep learning based approaches for action and gesture recognition in image sequences 以及最后的YouTube-8M数据库的情况:原创 2017-10-09 17:02:00 · 3787 阅读 · 1 评论 -
运行iDT算法代码及后续特征编码
DT&IDT算法应该算是行为识别领域中经典中的经典了,自从13年提出以来,在HMDB-51和UCF-101等若干个数据库上得到了非常好的效果,虽然DT&IDT算法做不过深度学习,但是由于其算法的有效性,现在大部分都是以“Ours+IDT”的形式呈现在论文里,并且加上了IDT后,结果的确能得到很明显的提升。 具体IDT算法的讲解可以参考博客:行为识别笔记:improved dens...原创 2017-11-27 09:28:20 · 5135 阅读 · 77 评论 -
论文翻译:ImageNet Classification with Deep Convolutional nerual network
这篇文章是我大四毕设的翻译外文文献,第一次翻译,而且以前也没有接触过深度学习方面的内容,很多词语表述还存在问题,有待修改。基于深度卷积神经网络的图片网络分类Alex Krizhevsky University of Toronto kriz@cs.utoronto.ca Ilya Sutskever University of Toronto ...翻译 2016-04-13 11:13:22 · 2885 阅读 · 0 评论 -
语义分割研究进展
原文地址:http://m.blog.csdn.net/article/details?id=52434826介绍图像语义分割,简单而言就是给定一张图片,对图片上的每一个像素点分类从图像上来看,就是我们需要将实际的场景图分割成下面的分割图: 不同颜色代表不同类别。 经过我阅读“大量”论文(羞涩)和查看Pascal VOC 2012 Learderboard,我发现图像语义分割从深度学习引入原创 2017-02-20 16:00:31 · 2148 阅读 · 0 评论 -
latex使用小记录
添加参考文献在Google scholar中搜索指定文献,点击引用中的BibTex,复制内容粘贴到egbib.tex中在文章中输入\cite{} ,选择并确定图片1、插入图片 图片插入前的工作:用Visio画好图,转成PDF格式,再用专业版的PDF剪切去白边 *注:用Visio是因为可以画矢量图(用PPT画好像也可以),用专业版PDF剪切是可以去背景。 latex中插入原创 2017-06-09 17:15:42 · 1284 阅读 · 0 评论 -
写论文时的一些高大上词句
仿佛回到了高中拿个小本本记录好词好句的时代…影响(影响很大) dominate 虽然,即使 albeit 简明的 succinct 竞争的流 contending flows 有害的 detrimental 通过…证明 this is borne out by 缓慢的上升 slow ramp-up 相矛盾地 at odds 关键,核心 crux 百分之X X percenti原创 2017-06-09 17:22:23 · 3816 阅读 · 0 评论 -
论文阅读:Multi-scale orderless pooling of deep convolutional activation features
2014年ECCV Motivation以往的图像分类,关注的信息可能更容易被干扰。比如下图中的(a),groundtruth应该是滑雪(ski),但是由于一些其他信息的干扰,导致红框中框出来的部分被分类为shovel,篮框中被认为是阿尔卑斯山,那么这篇论文就是基于这样一个motivation,试图关注图像中更细节的信息。 Basic IdeaMulti-sca...原创 2017-08-17 21:38:58 · 756 阅读 · 0 评论 -
论文阅读:Deep Filter Banks for Texture Recognition and Segmentation
2015年的CVPR,深度卷积特征+Fisher Vector的方法在纹理数据库上得到了比较优秀的performanceMotivation: 作者认为,对于纹理特征来说,使用全连接层的特征有一下三个问题:卷积层的特征更像一个非线性的滤波器,而全连接层能够扑捉到空间的信息,但这对纹理的表示没有用的输入层必须固定尺寸以适应全连接层的大小,这需要大量的计算浅层具有更好的传递...原创 2017-09-10 21:10:02 · 1926 阅读 · 0 评论 -
视频分类数据集
近年来为推动视频分类的研究,陆续发布了相关的视频数据集。小型标注良好的数据集如KTH,Hollywood2,Weizmann;中型的数据集如UCF101,Thumos’14和HMDB51,这些数据集超过了50类行为类别;大型数据集如Sports-1M,YFCC-100M,FCVID数据集,ActivityNet数据集,YouTube-8M等。原创 2017-10-08 18:24:19 · 5015 阅读 · 0 评论 -
Action recognition进展介绍
原文地址:http://blog.csdn.net/wzmsltw/article/details/70239000随着深度学习技术的发展,以及计算能力的进步(GPU等),现在基于视频的研究领域越来越受到重视。视频与图片最大的不同在于视频还包含了时序上的信息,此外需要的计算量通常也大很多。目前主要在做视频中动作定位相关的工作,为了开拓思路,读了不少视频分析相关领域的文章,所以打算写几篇博客,对...原创 2017-10-08 18:21:59 · 919 阅读 · 0 评论 -
论文阅读:Network In Network
源码及论文地址:https://github.com/BVLC/caffe/wiki/Model-Zoo#network-in-network-model这篇paper改进了传统的CNN网络,采用了少量的参数就轻松击败了Alexnet网络,Alexnet网络参数大小是230M,采用这篇paper的算法才29M,减小了将近10倍。另外,这篇paper提出的网络结构,是对传统CNN网络的一...原创 2018-03-16 16:40:33 · 859 阅读 · 0 评论 -
论文阅读:Learnable pooling with Context Gating for video classification
这篇论文是2016年Google Cloud & YouTube-8M Video Understanding Challenge比赛中冠军得主的论文。 文章的两点贡献:融合了VLAD, bag-of-visual-words和Fisher Vector三种编码方式,并且每个都做了一定程度的调整。其中,VLAD改为NetRVLAD, bag-of-visual-words改为Sof...原创 2017-10-09 21:29:01 · 1511 阅读 · 0 评论 -
Temporal Segment Networks(TSN)实验及错误日志
TSN是16年Activity Challenge比赛中”untrimmed video classification”项目的冠军。 TSN项目代码地址:https://github.com/yjxiong/temporal-segment-networks实验流程记录参考README.md下载项目代码,并编译git clone --recursive http...原创 2018-04-16 11:17:47 · 4248 阅读 · 22 评论