![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文阅读
文章平均质量分 92
Jeremy_lf
知所先后
展开
-
SSD论文阅读笔记
SSD网络主体设计的思想是特征分层提取,并依次进行边框回归和分类。因为不同层次的特征图能代表不同层次的语义信息,低层次的特征图能代表低层语义信息(含有更多的细节),能提高语义分割质量,适合小尺度目标的学习。高层次的特征图能代表高层语义信息,能光滑分割结果,适合对大尺度的目标进行深入学习。特点有三个:1、采用卷积进行检测;2、设置Default boxes;3、采用多尺度特征图用于检测Background1、每个网格只能预测一个物体,容易漏检,召回率低;2、对于物体的额尺度比较敏感,小物体检测不好,原创 2021-01-24 17:02:11 · 247 阅读 · 0 评论 -
Pytorch实现FPN及FCOS,附有详细注释!
class FPN(nn.Module): def __init__(self, block, layers): super(FPN, self).__init__() self.inplanes = 64 self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False) self.bn1 = nn.BatchNorm2d(64)原创 2020-07-04 19:34:00 · 1925 阅读 · 1 评论 -
CVPR2020论文阅读——超强通道注意力模块ECANet!
Abstract最近,通道注意机制已被证明在改善深度卷积神经网络(CNN)的性能方面具有巨大潜力。然而,大多数现有方法致力于开发更复杂的注意模块以实现更好的性能,这不可避免地会增加模型的复杂性。 为了克服性能和复杂性折衷之间的矛盾,本文提出了一种有效的信道注意(ECA)模块,该模块仅包含少量参数,同时带来明显的性能提升。 通过剖析SENet中的通道注意模块,我们从经验上表明避免降维对于学习通道注意很重要,并且适当的跨通道交互可以在保持性能的同时显着降低模型的复杂性。因此,我们提出了一种无需降维的局部跨通.原创 2020-07-02 17:11:11 · 16758 阅读 · 11 评论 -
【目标检测】FCOS:Fully Convolutional One-Stage Object Detection【附pytorch实现】
Abstract我们提出了一种完全卷积的一阶段目标检测器(FCOS),以按像素预测的方式来解决对象检测,类似于语义分割。几乎所有最新的物体检测器(例如RetinaNet,SSD,YOLOv3和Faster R-CNN)都依赖于预定义的锚框。相反,我们提出的目标检测器FCOS不含锚点和锚框。通过消除预定义的锚框,FCOS完全避免了与锚框相关的复杂计算,例如在训练过程中计算重叠。更重要的是,我们还避免了所有与锚框相关的超参数,这些超参数通常对最终检测性能非常敏感。借助唯一的后处理非最大抑制(NMS),带有Re原创 2020-06-29 20:44:28 · 803 阅读 · 1 评论 -
目标检测网络—SPPNet详解
翻译论文:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition概述当前深度卷积神经网络(CNNs)都需输入固定的图像尺寸(fixed-size),如224×224)。这种需要是“人为”的,并且当面对任意尺寸或比例的图像时,识别精度会降低。而论文中提出的**“空间金字塔池化”(spatial p...原创 2020-05-03 14:09:47 · 2662 阅读 · 3 评论 -
卷积神经网络的发展及各模型的优缺点
前沿在CV领域,我们需要熟练掌握最基本的知识就是各种卷积神经网络CNN的模型架构,不管我们在图像分类或者分割,目标检测,NLP等,我们都会用到基本的CNN网络架构。CNN从最初的2012年AlexNet横空出世到2014年VGG席卷世界以及2015年ResNet奠定了该领域的霸主地位,网络模型变得越变越深,而且也得到证明,越深的网络拟合效果越好,但网络相应的参数量计算量都极速增加,不利于技术的...原创 2020-04-14 17:35:10 · 14140 阅读 · 0 评论 -
深度学习基础知识总结(一)
1、推导反向传播算法2、Relu激活函数的优缺点?优点包括:1、解决了梯度消失、爆炸的问题2、计算方便,计算速度快,求导方便3、加速网络训练缺点包括:1、由于负数部分恒为0,会导致一些神经元无法激活2、输出不是以0为中心3、Sigmoid函数与Softmax函数从函数定义上来看,sigmoid激活函数的定义域能够取任何范围的实数,而返回的输出值在0到1的范围内。sigmoid...原创 2020-04-08 22:03:39 · 777 阅读 · 0 评论 -
关于目标检测之Faster-RCNN的理解
Faster-RCNN(2015年)该目标检测算法是基于Fast-RCNN的基础上,进行了改进,主要是对RCNN和Fast-RCNN中的用Selective Research方法生成的候选框进行改进。提出了一种RPN生成候选框的方法。FasterRCNN由两个模型组成,第一个就是RPN(深层全卷积网络)生成候选区域,第二个就是使用FastRCNN对候选区域进行检测。相比FASTER-RCNN...原创 2020-04-02 17:59:19 · 474 阅读 · 0 评论 -
关于目标检测RCNN(Fast-RCNN/Faster-RCNN)系列的理解
目前较为成熟的目标检测算法可总结如下:RCNN(2014年)RCNN是一个多阶段训练模型,包括生成候选区域,CNN微调,SVM分类训练以及边界框回归等多个步骤(Selective Research+CNN+SVM)。整体流程类似于滑动窗口思想,R-CNN 采用对区域进行识别的方案,具体是:1、给定一张输入图片,从图片中提取 2000 个类别独立的候选区域。2、对于每个区域利用 CNN...原创 2020-04-02 00:56:07 · 901 阅读 · 0 评论 -
关于目标检测中的候选区域Region Proposal的理解
目标检测指的是在一张图像中能够检测出物体所在的区域并且给出物体类别概率,其核心可以分为定位与识别两大模块。定位指的是我们在目标图像中锁定物体所在的区域,然后送入分类网络完成物体的识别。图像定位常用方法具体介绍如下:滑窗法—sliding window滑窗法是指用不同大小的窗口在整个图像上进行滑动,然后对每个窗口区域进行检测,复杂度极大,效率低下,此外还必须考虑到高宽比例不一致的情况,搜索变得...原创 2020-03-31 23:01:31 · 3154 阅读 · 0 评论 -
时间与空间复杂度解析
文章转载于:https://blog.csdn.net/haha223545/article/details/93619874 仅作为学习一、说明时间复杂度和空间复杂度是用来评价算法效率高低的2个标准,身为开发者肯定会经常会听到这2个概念,但它们分别是什么意思呢?其实这两个概念从字面意思上也能看出一二:时间复杂度:就是说执行算法需要消耗的时间长短,越快越好。比如你在电脑上打开计算器,...转载 2020-03-19 18:38:56 · 120 阅读 · 0 评论 -
关于CRNN文本识别算法的理解
一、简介常用文本识别算法有两种:CNN+RNN+CTC(CRNN+CTC)CNN+Seq2Seq+Attention其中CTC与Attention相当于是一种对齐方式,具体算法原理比较复杂,就不做详细的探讨。其中CTC可参考这篇博文,关于Attention机制的介绍,可以参考我的另一篇博文。CRNN 全称为 Convolutional Recurrent Neural Networ...原创 2020-03-12 02:09:00 · 3471 阅读 · 2 评论 -
RNN最全变体形式详解
参考:https://blog.csdn.net/bestrivern/article/details/90723524一.概述RNN用于处理序列数据。在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如,你要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独...原创 2020-03-11 15:45:27 · 3756 阅读 · 0 评论 -
详细剖解Levenshtein距离算法(附python实现)
在实习期间,看到同事在做文字识别的相关项目,用Levenshtein距离作为评价模型好坏的标准之一。由于是行外人,当时对这个算法并没有任何了解,只听他介绍是用来判断两个字符是否相似的一种指标吧,直到后来自己也做NLP相关的项目,才好好钻研了一番,特此记录。一、Levenshtein距离一般的,我们在NLP中评价模型的时候,经常会使用计算得到的Levenshtein距离作为模型的评分(正确率...原创 2020-02-29 01:38:06 · 10644 阅读 · 2 评论 -
MTCNN+FaceNet实现人脸检测与识别
人脸识别人脸识别包括两个模块人脸检测(人脸定位)+人脸识别。常用的人脸检测的算法有Dilb,OpenCV,OpenFace,MTCNN等。常用人脸识别的算法包括FaceNet,InsightFace模型等。本文以MTCNN结合FaceNet实现人脸的检测与识别。1、MTCNNMTCNN(Multi-task convolutional neural network,多任务卷积神经网络)是2...原创 2020-02-26 23:13:47 · 5891 阅读 · 0 评论 -
遗传算法与进化策略的对比
基于对生物进化机制的模仿,共产生进化算法的四种典型模型:①遗传算法 Genetic Algorithm,GA②进化规划 Evolutionary Programming,EP③遗传规划 Genetic Programming,GP④进化策略 Evolution Strategy, E一、遗传算法(GA)遗传算法是仿真生物遗传学和自然选择机理,通过人工方式所构造的一类搜索算法,从某种程度...原创 2020-02-26 00:13:22 · 9167 阅读 · 0 评论 -
Sift特征提取算法
2004 年D.Lowe 提出了一个新的算法:尺度不变特征变换(SIFT),这个算法可以帮助我们提取图像中的关键点并计算它们的描述符。SIFT算法的特点就是,对于局部特征对旋转、缩放、亮度变化保持不变。SIFT 算法主要内容如下:(1)尺度空间的极值检测(2)特征点定位(3)特征方向赋值(4)特征点的描述1、尺度空间——建立统一的认知,考虑多尺度多分辨率图像金字塔:a、对原图进行平...原创 2020-02-16 21:42:43 · 623 阅读 · 0 评论 -
关于RNN的理解
简单循环神经网络一个简单的循环神经网络如,它由输入层、一个隐藏层和一个输出层组成:如果把上面有W的那个带箭头的圈去掉,它就变成了最普通的全连接神经网络。x是一个向量,它表示输入层的值(这里面没有画出来表示神经元节点的圆圈);s是一个向量,它表示隐藏层的值(这里隐藏层面画了一个节点,你也可以想象这一层其实是多个节点,节点数与向量s的维度相同);U是输入层到隐藏层的权重矩阵;o也是一个向量,它表...原创 2019-12-10 13:30:11 · 964 阅读 · 0 评论 -
阅读笔记:注意力机制详解
原文链接:https://blog.csdn.net/malefactor/article/details/78767781作者:张俊林博士最近两年,注意力模型(Attention Model)被广泛使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中,是深度学习技术中最值得关注与深入了解的核心技术之一。本文以机器翻译为例,深入浅出地介绍了深度学习中注意力机制的原理及关键计算...转载 2019-11-29 14:15:42 · 622 阅读 · 0 评论 -
论文阅读:Neural Machine Translation By Jointly Learning To Align And Translate
题目:Neural Machine Translation By Jointly Learning To Align And Translate作者:Dzmitry Bahdanau,KyungHyun Cho, Yoshua Bengio∗论文地址:https://arxiv.org/abs/1409.04731、Introduction神经机器翻译是机器翻译的一种新兴方法,最近由Kal...原创 2019-11-28 16:25:04 · 1579 阅读 · 0 评论