文献阅读笔记_工长山的博客-CSDN博客

文献阅读笔记

关注

关注数：文章数：18 文章阅读量：105697 文章收藏量：125

作者: 工长山

求推荐深度学习工程师，我的简历：https://raw.githubusercontent.com/basaltzhang/cv_zhangyifeng/master/cv_%E5%BC%A0%E5%B1%B9%E5%B3%B0.pdf

展开

精读As-Projective-As-Possible Image Stitching with Moving DLT

文章标题As-Projective-As-PossibleImage Stitching with Moving DLT，来自CVPR 2013，文章主页，PDF。摘要本文主要目的是做图像拼接，使用MovingDirect Linear Transformation (MDLT)算法，强调全局投影(Globallyprojective)特性，同时允许局部非投影(local non-pr

原创 2013-07-21 20:31:49 · 14268 阅读 · 21 评论
我读GoogLeNet

背景主要贡献Motivation现状解决办法网络分析第 1 行卷积层第 2 行pooling层第 5 行 Inception module怎么增加网络宽度的为什么说会降低参数个数实验部分ClassificationObject Detection0. 背景获得2014年ImageNet挑战赛(ILSVRC14)第一名，google出品 paper地址：going deepe

原创 2016-08-19 00:29:41 · 5621 阅读 · 19 评论
[完结]saliency filters精读之permutohedral lattice

一、背景碎碎念之前的saliency filter引用了一篇Adams的Fast high-dimensionalfiltering using the permutohedral lattice，2010（见引用4），看了很多遍，感觉由于篇幅受限略过去了很多东西，数学又是属于基础的问题，看起来很慢。不死心继续搜，终于功夫不负有心人，Adams在2011年写了篇HIGH-DIMENSIONA

原创 2012-09-28 22:40:08 · 17976 阅读 · 26 评论
我读FaceNet

背景论文地址：FaceNet: A Unified Embedding for Face Recognition and Clustering 代码地址：GitHub（非官方）谷歌人脸检测算法，发表于 CVPR 2015，利用相同人脸在不同角度等姿态的照片下有高内聚性，不同人脸有低耦合性，提出使用 cnn + triplet mining 方法，在 LFW 数据集上准确度达到 99.63%，在

原创 2016-12-18 11:29:24 · 17528 阅读 · 2 评论
我读SSD

背景论文地址：SSD: Single Shot MultiBox Detector 代码地址：GitHub 视频：Video 这篇文章发表于 ECCV 2016，在 YOLO 的 grid cell 之上做了一些工作，结合 Faster R-CNN 的 anchor，使用卷积方式对每幅图只计算一次就能够得到最终检测结果。速度比 YOLO 快，且精度高于 Faster R-CNN。现状在 R-

原创 2016-11-21 23:34:51 · 2460 阅读 · 5 评论
我读ResNeXt

背景论文地址：Aggregated Residual Transformations for Deep Neural Networks 代码地址：GitHub 这篇文章在 arxiv 上的时间差不多是今年 cvpr 截稿日，我们就先理解为是投的 cvpr 2017 吧，作者包括熟悉的 rbg 和何凯明，转战 Facebook 之后代码都放在 Facebook 的主页里面了，代码也从 caffe

原创 2016-12-04 17:49:28 · 15047 阅读 · 4 评论
我读YOLO

背景论文地址：You Only Look Once: Unified, Real-Time Object Detection 主页：YOLO: Real-Time Object Detection 此篇文章发表于 CVPR 2016，RBG 挂名的一篇物体检测方法，作者是 Joseph Redmon，了解的同学可以补充一下他的经历，据说可八。主要贡献加速物体检测，YOLO 的 mAP 与 R-

原创 2016-11-06 00:40:51 · 3119 阅读 · 1 评论
我读R-FCN

背景论文地址：R-FCN: Object Detection via Region-based Fully Convolutional Networks 代码地址：GitHub贡献文章发表于 NIPS 2016，何凯明组新品。训练和测试速度比上一篇 Faster R-CNN 都有提高，单张图片测试用时 170ms，比 Faster R-CNN 快 2.5-20 倍，并且准确度略有提升（0.2%？）

原创 2016-10-30 00:35:23 · 3350 阅读 · 0 评论
缓更声明

伴随着使命召唤13的发布，我读系列可预见的更新缓慢，请见谅。叩首……

原创 2016-11-06 23:02:45 · 461 阅读 · 1 评论
我读ResNet

0. 背景论文地址：Deep Residual Learning for Image Recognition 代码地址：GitHub 这篇论文是 ILSVRC 2015 年冠军，由 MSRA 何凯明团队提出，提出了迄今为止最深的网络——152 层的神经网络构成分类器，并且提出解决随着层数增加，训练误差增大的方案。1. 问题深度学习随着层数增加，效果变好。举例：Alexnet是10层，VGG16

原创 2016-09-10 16:10:39 · 4851 阅读 · 3 评论
我读Batch Normalization

论文地址：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 论文代码：GitHub0. 背景从标题中我们就可以看出，本文是通过 Batch Normalization 来 Reducing Internal Covariate Shift 加速神经网络训练。在上篇

原创 2016-09-18 19:48:10 · 2324 阅读 · 0 评论
我读Faster R-CNN

论文地址：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 代码地址：GitHub背景R-CNN 三部曲之完结篇，在上一篇物体检测需要 Selective Search 获取 proposal，然后神经网络分类基础上，将获取 proposal 和 detection 合并为同一个神经网络，算

原创 2016-09-03 23:52:54 · 820 阅读 · 0 评论
我读R-CNN

热烈祝贺中国女排第三次夺得奥运金牌，女排精神传承不老！0. 背景论文地址：Rich feature hierarchies for accurate object detection and semantic segmentation 代码地址：GitHubR-CNN 是 Object Detection的一种方法，2012 年由 rbg 大神提出，该方法在当年的 PASCAL VOC 2012

原创 2016-08-21 23:44:18 · 616 阅读 · 0 评论
我读Fast R-CNN

0. 背景论文地址：Fast R-CNN 代码地址：GithubFast R-CNN 发表在 ICCV 2015 上，主要是针对 R-CNN 速度慢问题做了优化，参考了微软亚研院 Kaiming He 设计的 SPPnets，加速了 R-CNN 大约 200 倍（测试用时），同时检测效果也比之前优秀（很小）。另外我想说，好久没有看到这么简洁的标题了。1. 贡献整合了自己提出来的 R-CNN 与 S

原创 2016-08-27 22:33:40 · 1061 阅读 · 0 评论
我读Fine-Grained Change Detection of Misaligned Scenes with Varied Illuminations

背景介绍本文贡献实现方法数据采集FtextbfF的初始化Normal-aware lighting correction相机几何校正Low-rank变化检测Coarse-to-fine优化以及最终结果实验结果背景介绍文章标题：Fine-Grained Change Detection of Misaligned Scenes with Varied Illuminations，IC

原创 2015-10-24 12:00:06 · 2048 阅读 · 4 评论
我读Saliency Filters cvpr 2012

我的ppt讲稿如下，如有不对请指出，大家共同进步http://download.csdn.net/detail/xuanwu_yan/4693016saliency有很多人在做，发文章相对来说也容易一些。此篇文章的主要贡献有两个，一个是提出了新的方法提取saliency，另外一个就是对其进行了加速。本文中只对第一点进行讲解。论文中提出的新方法提取saliency，主要有两点：一个

原创 2012-07-10 21:09:18 · 6437 阅读 · 23 评论
我读Boosting Saliency CVPR 2012

原创手打，转载请注明出处。如有疑问或者错误，留言即可。讲稿ppt：http://download.csdn.net/detail/xuanwu_yan/4852558Boosting Bottom-up and Top-down Visual Features for Saliency这篇文章的作者是Ali Borji，Pdf，三篇cvpr_2012，明年有篇TPAMI本文主要提取

原创 2012-12-06 11:02:16 · 2856 阅读 · 0 评论
我读DenseNet

背景之前听说过DenseNet，再次被提起是因为七月初上交大主办的SSIST 2017，Yann Lecun的一页PPT，将其地位放置到如此之高，查了一下是CVPR 2017的一篇Oral，于是下定决心好好拜读一下。1 文章地址：https://arxiv.org/abs/1608.06993 代码地址：Torch版本，TensorFlow版本，MxNet版本，Caffe版本，方法我们回顾一

原创 2017-07-12 23:54:25 · 4864 阅读 · 1 评论

文献阅读笔记

作者: 工长山

精读As-Projective-As-Possible Image Stitching with Moving DLT

我读GoogLeNet

[完结]saliency filters精读之permutohedral lattice

我读FaceNet

我读SSD

我读ResNeXt

我读YOLO

我读R-FCN

缓更声明

我读ResNet

我读Batch Normalization

我读Faster R-CNN

我读R-CNN

我读Fast R-CNN

我读Fine-Grained Change Detection of Misaligned Scenes with Varied Illuminations

我读Saliency Filters cvpr 2012

我读Boosting Saliency CVPR 2012

我读DenseNet