论文阅读
文章平均质量分 92
maocaisheng
Image Restoration
展开
-
Flash-Attention 1&2 论文理解
Flash-Attention 1&2 论文理解原创 2023-11-15 11:59:54 · 365 阅读 · 0 评论 -
CornetNet
CornerNet: Detecting Objects as Paired KeypointsECCV 2018 GitHub主页概要:1.单阶段检测器,但是速度还是很慢(在改进版CornerNet-Lite 中提到);2.Anchor-Free,是第一次尝试 将目标框的检测(中心点+宽高)转换为关键点检测(左上点+右下点);3.COCO 数据集上单尺度测试精度为40.5,多尺度测试为...原创 2019-04-29 16:01:56 · 3285 阅读 · 1 评论 -
反卷积与语义分割
《Learning Deconvolution Network for Semantic Segmentation》阅读笔记FCN首先论文对比《Fully convolutional networks for semantic segmentation》提到的FCN: 基于CNN的语义分割算法致力于解决原始图片每个像素的标签(pixel-wise labeling)问题。将用于分类问题的CNN原创 2016-11-17 16:29:32 · 4192 阅读 · 1 评论 -
VGG 模型
《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》阅读笔记这篇论文从网络深度方向研究得出这个结论: “ a deep net with small filters outperforms a shallow net with larger filters.”实验论文做了这样一个实验: 从左到右网络整体结构不变,原创 2016-11-27 14:09:24 · 5921 阅读 · 0 评论 -
AlexNet模型
《ImageNet Classification with Deep Convolutional Neural Networks》阅读笔记 一直在使用AlexNet,本来早应该读这篇经典论文了。可能是这篇论文涉及到的理论有点多,解释不是很通俗,有了一段时间的实际经验后读完这篇论文深有感悟。 下面按论文的标题分别记录:The DatasetILSVRC:1000类,每类约1000张图片,大约有12原创 2016-11-30 21:42:24 · 5963 阅读 · 0 评论 -
DenseNet模型
《Densely Connected Convolutional Networks》阅读笔记 代码地址:https://github.com/liuzhuang13/DenseNet首先看一张图: 稠密连接:每层以之前层的输出为输入,对于有L层的传统网络,一共有LL个连接,对于DenseNet,则有L(L+1)2\frac {L(L+1)} 2。这篇论文主要参考了Highway Netw原创 2016-12-05 18:55:27 · 55899 阅读 · 10 评论 -
R-CNN
《Rich feature hierarchies for accurate object detection and semantic segmentation》阅读笔记R-CNN:Regions with CNN featuresCNN一般用于分类,而R-CNN则用于目标检测,这里摘取VOC(Visual Object Classes)数据集官网中的一段话,说明二者的区别: Classifi原创 2016-12-28 18:57:06 · 788 阅读 · 0 评论 -
局部特征与图像检索
Exploiting Local Features from Deep Networks for Image Retrieval 阅读笔记摘要这篇⽂章发表在CVPR 2015 workshop上,是来⾃于马⾥兰⼤学帕克学院Joe Yue-Hei Ng等⼈的⼯作。近期的很多研究⼯作表明,相⽐于全相连层的输出,卷积层的特征图谱(feature map)更适⽤于实例搜索。本篇⽂章介绍了如何将卷积层的特征图原创 2017-02-08 13:01:50 · 5222 阅读 · 0 评论 -
深度哈希-DSH
论文:Deep Supervised Hashing for Fast Image Retrieval CVPR2016 源代码: https://github.com/lhmRyan/deep-supervised-hashing-DSH 论文网络结构似乎是CIFAR-10和Siamese两种网络的结合: 个人认为有两个创新点: 1、通过设计损失函数,使得最后一层的输出Bi原创 2017-03-07 19:01:31 · 7956 阅读 · 4 评论 -
深度哈希-DHN
Deep Hashing Network for Efficient Similarity Retrieval AAAI 2016 源码:https://github.com/zhuhan1236/dhn-caffe与上一篇文章类似,通过设计损失函数,使得最后全连接层的输出分布近似于二值{-1,+1}分布。不过这篇论文从理论上说明了为什么这样设计损失函数。 哈希方法的目标是得到二值编码,所以优原创 2017-03-08 19:33:54 · 8667 阅读 · 0 评论 -
细粒度分类-车辆分类
Embedding Label Structures for Fine-Grained Feature Representation CVPR 2016首先get到了关于image understanding常见的四个名词,困扰了我好久:classification 分类detection 检测segmentation 分割retrieval 检索再关于网络模型的有:identific原创 2017-03-31 21:02:44 · 12914 阅读 · 15 评论 -
Spatial Pyramid Pooling
《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》 可能GoogLenet和Oxford VGG太过于出名了,掩盖了这篇论文介绍的SPP-net,至今才读到这篇论文。 SPP-net在ILSVRC2014比赛中,排名第三,单个模型精度排名第二(仅次于VGG)。 这篇论文的贡献不是提出了新原创 2017-05-04 20:49:48 · 7404 阅读 · 0 评论