深度学习系列
weixin_45963617
这个作者很懒,什么都没留下…
展开
-
看FCOS时的小细节总结
1.permute(多维数组,[维数的组合])例:a=rand(2,3,4);这是一个三维数组,各维长度分别为2,3,4%现在交换第一维和第二维:permute(A,[2,1,3]) %变成3* 2*4的矩阵。2.仿射层(Affine Layer)神经网络中的一个全连接层。仿射(Affine)的意思是前面一层中的每一个神经元都连接到当前层中的每一个神经元。在许多方面,这是神经网络的「标准」层。仿射层通常被加在卷积神经网络或循环神经网络做出最终预测前的输出的顶层。仿射层的一般形式为 y = f(W原创 2020-10-14 09:18:32 · 257 阅读 · 0 评论 -
CNN系列模型发展简史(附代码,已全部跑通)
参考论文原创 2020-09-29 16:13:29 · 223 阅读 · 0 评论 -
个人数据集制作、转化为voc格式并融合
为了训练自己的数据集,需要将数据集转化为voc格式。通过以下6个步骤来实现。1.数据增强通过几种扩充方式来增加数据,如亮度增强、对比度增强、旋转、翻转和加入噪声(每种方法在最后均需将图片resize成300*300的大小)。代码:improve.py2.标记使用labelme进行标注,得到json文件,也可以通过labelmg标注,直接可得到xml文件。标注信息包括目标类别与包围框信息,训练集:cat_cat1_1,测试集:cat_cat1_1,第一个信息代表父类,第二个信息代表子类,最后一个代表原创 2020-06-18 11:11:35 · 757 阅读 · 0 评论 -
EfficientDet: Scalable and Efficient Object Detection
记录一下,方便复习原创 2020-07-15 17:24:50 · 79 阅读 · 0 评论 -
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
一、Introduction先前的工作中,通常只缩放深度、宽度和分辨率中的一个,尽管可以任意缩放二维或三维,但任意缩放需繁琐的手动调整,且常产生次优的精度和效率。不像传统的做法是任意缩放这些因素,我们统一缩放网络的深度、宽度和分辨率与一组固定的比例系数。例,如果我们想用2^N倍的计算资源, 那么网络深度将增加α^N, 宽度增加β^N , 分辨率将增加γ^N,其中,α, β, γ是在原始小模型上通过小网格搜索确定的常数系数。二、复合模型缩放1.问题描述卷积网络的某一层i可由函数Yi = Fi(Xi)原创 2020-07-15 17:18:49 · 141 阅读 · 0 评论 -
channel pruning for accelerating very deep neural networks
一、Introduction1.cnn加速主要分为三类:optimized implementation 优化实现、quantization量化、structured simplification结构化简化(本文)2.structured simplification结构化简化主要包括三种方法:(1)张量分解:将卷积层分解为几个有效的卷积层,但通道数不能减少,这使得网络很难分解为1 × 1卷积层,这种方法会带来额外的计算开销。(2)稀疏连接:使神经元或通道间的连接失效,且具有“不规则”的形状,不原创 2020-07-15 16:38:37 · 417 阅读 · 0 评论 -
CBNet--一种新的目标检测的复合骨干网体系结构
一、Introduction一般来说,在一个典型的基于CNN的目标检测器中,使用主干网络来提取检测对象的基本特征,该网络通常是为图像分类任务而设计的,并在ImageNet上预训练。毫无疑问,更强大的主干网可以带来更好的检测性能。尽管最先进的基于深度的大骨干网络的探测器取得了很好的结果,但仍有很大改进空间。此外,通过设计一个新的更强大的主干网络并在ImageNet上预训练来获取好的检测性能是十分昂贵的。且由于几乎所有现有的主干网络最初都是为图像分类而设计的,直接使用它们来提取目标检测的基本特征可能会导致性能原创 2020-07-14 21:22:58 · 1434 阅读 · 0 评论 -
神经网络压缩--Deep Compression
Introduction神经网络功能强大。但是,其巨大的存储和计算代价也使得其实用性特别是在移动设备上的应用受到了很大限制。所以,本文的目标就是:降低大型神经网络其存储和计算消耗,使得其可以在移动设备上得以运行,即要实现 “深度压缩”。实现的过程主要有三步:(1) 通过移除不重要的连接来对网络进行剪枝;(2) 对权重进行量化,使得许多连接共享同一权重,并且只需要存储码本(有效的权重)和索引;(3) 进行霍夫曼编码以利用有效权重的有偏分布;具体如下图:Network Pruning“剪枝”转载 2020-07-11 15:26:48 · 210 阅读 · 2 评论 -
Anchor-free系列——Bottom-up Object Detection by Grouping Extreme and Center Points
1 Abstract随着深度学习的发展,目标检测问题已经从一个由下到上的问题转变为一个由上到下的问题。(下文有详细介绍)当前最先进的目标检测算法首先枚举密集的目标可能存在的位置,然后对每一个位置分类判断是否存在目标,是前景还是背景。在本文中,作者认为,从下到上的方法仍然能够取得很好的性能。利用关键点预测网络预测四个极值点(最顶部、最左侧、最底部、最右侧)和一个中心点共五个关键点。如果五个关键点是几何对齐的,我们将它们分组到一个bounding box中,那么,目标检测问题就转化为一个纯的关键点估计问题,而转载 2020-07-09 22:56:11 · 236 阅读 · 0 评论 -
Anchor-free系列——CornerNet: Detecting Objects as Paired Keypoints
这篇发表在ECCV2018上的目标检测文章给人一种眼前一亮的感觉,简单说一下几个比较吸引我的点:1、将目标检测问题当作关键点检测问题来解决,也就是通过检测目标框的左上角和右下角两个关键点得到预测框,因此CornerNet算法中没有anchor的概念,这种做法在目标检测领域是比较创新的而且能够取得不错效果是很难的。2、整个检测网络的训练是从头开始的,并不基于预训练的分类模型,这使得用户能够自由设计特征提取网络,不用受预训练模型的限制。3、文章使用了corner pooling来定位角点。我们知道目前大转载 2020-07-09 15:45:51 · 127 阅读 · 0 评论 -
Focal Loss for Dense Object Detection
一、Introduction众所周知,detector主要分为以下两大门派:-one stage系代表性算法YOLOV1、SSD、YOLOV2、YOLOV3检测精度低(相对于two stage而言)检测速度快(相对于two stage而言)-two stage系代表性算法R-CNN、SPPNet、Fast R-CNN、Faster R-CNN检测精度高(相对于one stage而言)检测速度慢(相对于one stage而言转载 2020-07-07 22:50:52 · 378 阅读 · 0 评论 -
RCNN到Faster RCNN、yolo系列与SSD
fast rcnn:https://blog.csdn.net/shenxiaolu1984/article/details/51036677https://blog.csdn.net/u014380165/article/details/72851319faster rcnn:https://blog.csdn.net/weixin_43198141/article/details/90178512https://zhuanlan.zhihu.com/p/31426458yolo系列:htt原创 2020-06-26 12:24:43 · 298 阅读 · 0 评论 -
AttributeError: 'NoneType' object has no attribute 'shape'
除了上一篇博客出现的问题外,还遇到了如下的另一个问题:AttributeError: ‘NoneType’ object has no attribute 'shape’查了一下,大部分博客说是因为图片并没有读入参考,一部分博客说是因为文件路径有中文,我在cv2.imread后print图片,输出为None,所以我出错是因为并没有读入图片,仔细检查了一下,发现是因为我的图片命名里有一个空格,所...原创 2020-04-11 11:53:48 · 339 阅读 · 0 评论 -
ValueError: With n_samples=0, test_size=0.2 and train_size=None, the resulting train set will be emp
今天写代码labelmetovoc,即将labelme标注的转化为voc标准格式参考的这篇文章时遇到了如下问题:ValueError: With n_samples=0, test_size=0.2 and train_size=None, the resulting train set will be empty. Adjust any of the aforementioned parame...原创 2020-04-11 11:42:46 · 18916 阅读 · 20 评论 -
深度学习之SSD总结
SSD是一种直接预测目标类别和bounding box的多目标检测算法。它使用低层feature map检测小目标,使用高层feature map检测大目标。一、SSD的优势与劣势1.优势(1)没有生成边界框(proposal)的过程,进而提高了速度。(2)SSD的核心是预测固定的一系列默认边界框的类别分数和边界框偏移,使用更小的卷积滤波器应用到特征映射上。(3)为了实现高检测精度,我们...原创 2020-06-26 11:57:03 · 1608 阅读 · 1 评论