文献阅读笔记
工长山
求推荐深度学习工程师,我的简历:https://raw.githubusercontent.com/basaltzhang/cv_zhangyifeng/master/cv_%E5%BC%A0%E5%B1%B9%E5%B3%B0.pdf
展开
-
精读As-Projective-As-Possible Image Stitching with Moving DLT
文章标题As-Projective-As-PossibleImage Stitching with Moving DLT,来自CVPR 2013,文章主页,PDF。摘要本文主要目的是做图像拼接,使用MovingDirect Linear Transformation (MDLT)算法,强调全局投影(Globallyprojective)特性,同时允许局部非投影(local non-pr原创 2013-07-21 20:31:49 · 14268 阅读 · 21 评论 -
我读GoogLeNet
背景主要贡献Motivation现状解决办法网络分析第 1 行卷积层第 2 行pooling层第 5 行 Inception module怎么增加网络宽度的为什么说会降低参数个数实验部分ClassificationObject Detection0. 背景获得2014年ImageNet挑战赛(ILSVRC14)第一名,google出品 paper地址:going deepe原创 2016-08-19 00:29:41 · 5621 阅读 · 19 评论 -
[完结]saliency filters精读之permutohedral lattice
一、背景碎碎念之前的saliency filter引用了一篇Adams的Fast high-dimensionalfiltering using the permutohedral lattice,2010(见引用4),看了很多遍,感觉由于篇幅受限略过去了很多东西,数学又是属于基础的问题,看起来很慢。不死心继续搜,终于功夫不负有心人,Adams在2011年写了篇HIGH-DIMENSIONA原创 2012-09-28 22:40:08 · 17976 阅读 · 26 评论 -
我读FaceNet
背景论文地址:FaceNet: A Unified Embedding for Face Recognition and Clustering 代码地址:GitHub(非官方) 谷歌人脸检测算法,发表于 CVPR 2015,利用相同人脸在不同角度等姿态的照片下有高内聚性,不同人脸有低耦合性,提出使用 cnn + triplet mining 方法,在 LFW 数据集上准确度达到 99.63%,在原创 2016-12-18 11:29:24 · 17528 阅读 · 2 评论 -
我读SSD
背景论文地址:SSD: Single Shot MultiBox Detector 代码地址:GitHub 视频:Video 这篇文章发表于 ECCV 2016,在 YOLO 的 grid cell 之上做了一些工作,结合 Faster R-CNN 的 anchor,使用卷积方式对每幅图只计算一次就能够得到最终检测结果。速度比 YOLO 快,且精度高于 Faster R-CNN。现状在 R-原创 2016-11-21 23:34:51 · 2460 阅读 · 5 评论 -
我读ResNeXt
背景论文地址:Aggregated Residual Transformations for Deep Neural Networks 代码地址:GitHub 这篇文章在 arxiv 上的时间差不多是今年 cvpr 截稿日,我们就先理解为是投的 cvpr 2017 吧,作者包括熟悉的 rbg 和何凯明,转战 Facebook 之后代码都放在 Facebook 的主页里面了,代码也从 caffe原创 2016-12-04 17:49:28 · 15047 阅读 · 4 评论 -
我读YOLO
背景论文地址:You Only Look Once: Unified, Real-Time Object Detection 主页:YOLO: Real-Time Object Detection 此篇文章发表于 CVPR 2016,RBG 挂名的一篇物体检测方法,作者是 Joseph Redmon,了解的同学可以补充一下他的经历,据说可八。主要贡献加速物体检测,YOLO 的 mAP 与 R-原创 2016-11-06 00:40:51 · 3119 阅读 · 1 评论 -
我读R-FCN
背景论文地址:R-FCN: Object Detection via Region-based Fully Convolutional Networks 代码地址:GitHub贡献文章发表于 NIPS 2016,何凯明组新品。训练和测试速度比上一篇 Faster R-CNN 都有提高,单张图片测试用时 170ms,比 Faster R-CNN 快 2.5-20 倍,并且准确度略有提升(0.2%?)原创 2016-10-30 00:35:23 · 3350 阅读 · 0 评论 -
缓更声明
伴随着使命召唤13的发布,我读 系列可预见的更新缓慢,请见谅。叩首……原创 2016-11-06 23:02:45 · 461 阅读 · 1 评论 -
我读ResNet
0. 背景论文地址:Deep Residual Learning for Image Recognition 代码地址:GitHub 这篇论文是 ILSVRC 2015 年冠军,由 MSRA 何凯明团队提出,提出了迄今为止最深的网络——152 层的神经网络构成分类器,并且提出解决随着层数增加,训练误差增大的方案。1. 问题深度学习随着层数增加,效果变好。举例:Alexnet是10层,VGG16原创 2016-09-10 16:10:39 · 4851 阅读 · 3 评论 -
我读Batch Normalization
论文地址:Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 论文代码:GitHub0. 背景从标题中我们就可以看出,本文是通过 Batch Normalization 来 Reducing Internal Covariate Shift 加速神经网络训练。在上篇原创 2016-09-18 19:48:10 · 2324 阅读 · 0 评论 -
我读Faster R-CNN
论文地址:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 代码地址:GitHub背景R-CNN 三部曲之完结篇,在上一篇物体检测需要 Selective Search 获取 proposal,然后神经网络分类基础上,将获取 proposal 和 detection 合并为同一个神经网络,算原创 2016-09-03 23:52:54 · 820 阅读 · 0 评论 -
我读R-CNN
热烈祝贺中国女排第三次夺得奥运金牌,女排精神传承不老!0. 背景论文地址:Rich feature hierarchies for accurate object detection and semantic segmentation 代码地址:GitHubR-CNN 是 Object Detection的一种方法,2012 年由 rbg 大神提出,该方法在当年的 PASCAL VOC 2012原创 2016-08-21 23:44:18 · 616 阅读 · 0 评论 -
我读Fast R-CNN
0. 背景论文地址:Fast R-CNN 代码地址:GithubFast R-CNN 发表在 ICCV 2015 上,主要是针对 R-CNN 速度慢问题做了优化,参考了微软亚研院 Kaiming He 设计的 SPPnets,加速了 R-CNN 大约 200 倍(测试用时),同时检测效果也比之前优秀(很小)。另外我想说,好久没有看到这么简洁的标题了。1. 贡献整合了自己提出来的 R-CNN 与 S原创 2016-08-27 22:33:40 · 1061 阅读 · 0 评论 -
我读Fine-Grained Change Detection of Misaligned Scenes with Varied Illuminations
背景介绍本文贡献实现方法数据采集FtextbfF的初始化Normal-aware lighting correction相机几何校正Low-rank变化检测Coarse-to-fine优化以及最终结果实验结果背景介绍文章标题:Fine-Grained Change Detection of Misaligned Scenes with Varied Illuminations,IC原创 2015-10-24 12:00:06 · 2048 阅读 · 4 评论 -
我读Saliency Filters cvpr 2012
我的ppt讲稿如下,如有不对请指出,大家共同进步http://download.csdn.net/detail/xuanwu_yan/4693016saliency有很多人在做,发文章相对来说也容易一些。此篇文章的主要贡献有两个,一个是提出了新的方法提取saliency,另外一个就是对其进行了加速。本文中只对第一点进行讲解。论文中提出的新方法提取saliency,主要有两点:一个原创 2012-07-10 21:09:18 · 6437 阅读 · 23 评论 -
我读Boosting Saliency CVPR 2012
原创手打,转载请注明出处。如有疑问或者错误,留言即可。讲稿ppt:http://download.csdn.net/detail/xuanwu_yan/4852558Boosting Bottom-up and Top-down Visual Features for Saliency这篇文章的作者是Ali Borji,Pdf,三篇cvpr_2012,明年有篇TPAMI本文主要提取原创 2012-12-06 11:02:16 · 2856 阅读 · 0 评论 -
我读DenseNet
背景之前听说过DenseNet,再次被提起是因为七月初上交大主办的SSIST 2017,Yann Lecun的一页PPT,将其地位放置到如此之高,查了一下是CVPR 2017的一篇Oral,于是下定决心好好拜读一下。1 文章地址:https://arxiv.org/abs/1608.06993 代码地址:Torch版本,TensorFlow版本,MxNet版本,Caffe版本,方法我们回顾一原创 2017-07-12 23:54:25 · 4864 阅读 · 1 评论