![](https://img-blog.csdnimg.cn/2021013114594333.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
CV炼丹之路
文章平均质量分 92
CV方向论文学习笔记
KeEN丶X
这个作者很懒,什么都没留下…
展开
-
CV中的注意力机制学习笔记(下)
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。这一期接着记录一下CV中的注意力机制这几年的经典论文。SKNet论文全名为《Selective Kernel Networks》(原文链接:https://arxiv.org/abs/1903.06586),发表在CVPR 2019上。SKNet也是对于SENet的改进,其结合了Inception的思想,空间注意力这一部分就是使用多个不同大小的卷积核进行感知,以适配原创 2021-02-05 17:35:51 · 846 阅读 · 0 评论 -
CV中的注意力机制学习笔记(上)
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。这一期记录一下CV中的注意力机制这几年的经典论文发展历程。...原创 2021-02-04 18:33:06 · 791 阅读 · 1 评论 -
SegNet以及DeepLab系列学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。这一期接着介绍语义分割任务中的经典模型。SegNet论文全名为《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》(原文链接),是2017年的工作。SegNet也是一个Encoder-Decoder结构,并且编码器与解码器一一对应,tricks其实就一原创 2021-01-30 23:49:34 · 502 阅读 · 3 评论 -
FCN以及U-Net系列学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。这一期介绍几个语义分割任务中的经典模型。FCN论文全名为《Fully Convolutional Networks for Semantic Segmentation》(原文链接),发表在2015的CVPR上。这篇论文的贡献也是比较大的,在语义分割领域也算得上是旗帜性模型了,首先就是提出了一个端到端的网络,用卷积层代替传统的全连接层,使得输出也变成二维形式,**原创 2021-01-30 11:54:04 · 1070 阅读 · 0 评论 -
DSSD学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。这一期介绍基于SSD改进的DSSD。论文相关信息论文全名为《DSSD : Deconvolutional Single Shot Detector》(链接),从名字可以猜想到,改进之处应该在于使用了反卷积来上采样,然后融合不同尺度的特征图进行预测。作者相关信息如下:如果了解 FPN (链接)会明确感受到 SSD 有个不小的缺点:最早的模型将输入图片进行暴力缩放,原创 2020-11-06 03:20:51 · 901 阅读 · 0 评论 -
SSD学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。这一期仍然介绍目标检测中one stage类的模型——SSD。(图源网络)论文相关信息论文全名为《SSD: Single Shot MultiBox Detector》(链接),从名字可以看出,思路其实也是均匀地在图片的不同位置进行不同尺度的密集抽样,以适配不同形状的物体。作者相关信息如下:网络架构论文中与 YOLO 进行比较的 SSD 结构图:而且原创 2020-11-05 01:58:10 · 456 阅读 · 0 评论 -
YOLO v3学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。这一期先简要介绍 YOLO v3,因为 YOLO v3 相比于 YOLO v2 改进并不是很多,但不得不承认效果确实好;然后正好YOLO v4 也在今年发表了,放在一起来看吧。YOLO v3论文相关信息(链接):YOLO v3 的改进思路,也是在不牺牲或者少牺牲速度的基础上提高精度,最大的改变是在网络结构上,借鉴了 ResNet 、FPN 等结构,设计了 Dar原创 2020-10-21 16:19:16 · 260 阅读 · 1 评论 -
YOLO v2学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。上一期介绍了YOLO v1,这一期来介绍一下改进的YOLO v2(YOLO9000)。论文相关信息论文全名为《YOLO9000: Better, Faster, Stronger》(链接),题目很有趣,更好更快更强,搁这模仿奥林匹克口号呢?值得强调的一点是,为什么模型叫 YOLO9000 呢?因为作者说其可以检测9000多种目标类别。论文使用的数据集为 PASC原创 2020-10-18 18:30:33 · 359 阅读 · 1 评论 -
YOLO v1学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。这一期仍然介绍目标检测的网络——YOLO v1,其也是one stage算法的起源网络。论文相关信息论文全名为《You Only Look Once: Unified, Real-Time Object Detection》(链接),从名字也可以看出YOLO系列最大的优点就是速度快。这篇论文于2016年发表在CVPR上,使用的是PASCAL VOC 2007、201原创 2020-10-17 01:22:15 · 405 阅读 · 1 评论 -
Mask R-CNN学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。这一期介绍基于 Faster R-CNN 的 Mask R-CNN ,看看其如何改进使得模型出色地完成了实例分割任务。论文相关信息论文(链接)使用的数据集是MS COCO数据集,并且力压前几届的冠军模型们,比如FCIS,在COCO系列挑战赛的实例分割、边框目标检测以及人体关键点检测三个赛道中都取得了最佳成绩。网络架构论文中的架构图:更为清晰的图,转自这里:原创 2020-10-08 17:51:53 · 525 阅读 · 0 评论 -
Faster R-CNN学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。上一期的最后讲到了R-CNN的训练时间长的缺点,这一期来介绍改进后的Faster R-CNN,但在介绍Faster R-CNN之前想先简要介绍一下SPPNet和Fast R-CNN,标题...原创 2020-10-06 00:30:53 · 328 阅读 · 0 评论 -
Fast R-CNN学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。上一期讲的SPPNet基于R-CNN最大的改进,其实就是对整张图而不是对2000个候选框进行特征提取,加快了速度,这一期来看看Fast R-CNN又做出了哪些改进。论文相关信息《Fast R-CNN》(论文链接),于2015年发表在CVPR上,作者相关信息如下:论文所使用数据集为PASCAL VOC 2007、2010、2012数据集。网络架构从上图可以看原创 2020-10-04 15:50:21 · 177 阅读 · 0 评论 -
SPPNet学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。上一期的最后讲到了R-CNN的训练时间长的缺点,这一期先介绍一下改进的SPPNet.论文相关信息论文全名为《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》(论文链接),于2015年发表在IEEE上,作者相关信息如下:论文所使用数据集为 ImageNet原创 2020-10-04 13:42:39 · 191 阅读 · 0 评论 -
R-CNN学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。本期介绍RCNN,个人认为它是目标检测界的“AlexNet”,也是使得深度学习在目标检测任务中取得突破性进展的网络。论文相关信息论文全称为《Rich feature hierarchies for accurate object detection and semantic segmentation》,发表在2016年的IEEE上,作者及相关信息如下:论文所使用原创 2020-09-23 23:31:39 · 225 阅读 · 0 评论 -
Inception结构学习笔记(GoogLeNet续)
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。上一期介绍了基于InceptionV1提出的GoogLeNet,这一期介绍Inception的改进之路——InceptionV2到V4.一、InceptionV2 & V3相关的论文:1、《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covaria原创 2020-09-20 00:23:00 · 301 阅读 · 0 评论 -
GoogLeNet学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。本期介绍GoogLeNet系列。论文相关信息论文全称《》...原创 2020-09-18 23:16:57 · 289 阅读 · 0 评论 -
ResNet学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。本期介绍ResNet.论文相关信息论文全称为《Deep Residual Learning for Image Recognition》,于2016年发表在CVPR(即IEEE Conference on Computer Vision and Pattern Recognition,是由IEEE举办的计算机视觉和模式识别领域的顶级会议,也是CV方向三大顶会之一),原创 2020-08-20 19:37:32 · 755 阅读 · 0 评论 -
VGGNet学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。本期介绍VGGNet.论文相关信息论文全称为《Very Deep Convolutional Networks For Large-scale Image Recongnition》,于2015年发表在arXiv上(一个为了防止自己论文在收录前被别人剽窃,收录预稿的文档收录网站),作者及相关信息如下:自上一期谈到的AlexNet取得惊人结果之后,大家纷纷尝试在A原创 2020-08-13 18:46:22 · 334 阅读 · 0 评论 -
AlexNet学习笔记
本专栏将从论文的角度解读一下CV方向的一些经典神经网络模型及其贡献与意义,以期加深自己的印象,后续可以随时翻看并且学习其中好的tricks。本期首先介绍一下CNN具有历史突破性的网络——AlexNet.论文相关信息论文全称为《ImageNet Classification with Deep Convolutional Neural Network》,于2012年发表在NIPS上(全称神经信息处理系统大会,Conference and Workshop on Neural Information Pro原创 2020-08-06 16:01:55 · 363 阅读 · 0 评论