深度学习
zhw864680355
这个作者很懒,什么都没留下…
展开
-
轻量化网络:MobileNet v3解析
原文:Searching for MobileNetV3论文链接:https://arxiv.org/abs/1905.02244一、基本论述MobileNet v3发表于2019年,该v3版本结合了v1的深度可分离卷积、v2的Inverted Residuals和Linear Bottleneck、SE模块,利用NAS(神经结构搜索)来搜索网络的配置和参数。mobilenet-...转载 2020-04-13 22:46:16 · 39491 阅读 · 5 评论 -
深度特征融合---理解add和concat之多层特征融合
在各个网络模型中,ResNet,FPN等采用的element-wise add来融合特征,而DenseNet等则采用concat来融合特征。那add与concat形式有什么不同呢?事实上两者都可以理解为整合特征图信息。只不过concat比较直观,而add理解起来比较生涩。concatenate操作是网络结构设计中很重要的一种操作,经常用于将特征联合,多个卷积特征提取框架提取的特征融合或者是将输...转载 2020-04-11 17:09:34 · 1882 阅读 · 0 评论 -
卷积网络基础知识---Depthwise Convolution && Pointwise Convolution && Separable Convolution
卷积神经网络在图像处理中的地位已然毋庸置疑。卷积运算具备强大的特征提取能力、相比全连接又消耗更少的参数,应用在图像这样的二维结构数据中有着先天优势。然而受限于目前移动端设备硬件条件,显著降低神经网络的运算量依旧是网络结构优化的目标之一。本文所述的Separable Convolution就是降低卷积运算参数量的一种典型方法。常规卷积运算假设输入层为一个大小为64×64像素、三通道彩色图片。...转载 2020-04-11 16:21:43 · 1633 阅读 · 1 评论 -
ResNeXt结构解读
论文:Aggregated Residual Transformations for Deep Neural Networks (2017CVPR上)论文地址:https://arxiv.org/pdf/1611.05431.pdfPyTorch代码:https://github.com/miraclewkf/ResNeXt-PyTorch原文来源:https://blog.csdn....转载 2020-04-09 20:46:30 · 4402 阅读 · 0 评论 -
【目标检测】DSSD:Deconvolutional Single Shot Detector
论文:《DSSD:Deconvolutional Single Shot Detector》论文地址:https://arxiv.org/abs/1701.066591、背景SSD算法在检测小目标时精度并不高,本文是在在SSD的基础上做出一些改进,引入卷积层,能综合上下文信息,提高模型性能。DSSD针对小目标鲁棒性太差,提出了以下两个贡献:1. 把SSD的基准网络从VGG换成了Re...原创 2019-12-12 17:01:36 · 404 阅读 · 0 评论 -
SENet结构解读
原文:https://zhuanlan.zhihu.com/p/65459972一、前言在深度学习领域,CNN分类网络的发展对其它计算机视觉任务如目标检测和语义分割都起到至关重要的作用,因为检测和分割模型通常是构建在CNN分类网络(称为backbone)之上。提到CNN分类网络,我们所熟知的是VGG,ResNet,Inception,DenseNet等模型,它们的效果已经被充分验证,而且被...转载 2020-04-07 17:17:25 · 5787 阅读 · 1 评论 -
EfficientNet论文解析
《EfficientNet:Rethinking Model Scaling for Convolutional Neural Networks》论文地址:https://arxiv.org/pdf/1905.11946.pdf参考原文:https://www.cnblogs.com/dengshunge/p/11369695.html https:/...转载 2019-12-12 09:57:29 · 905 阅读 · 0 评论 -
【目标检测】Retinanet:Focal Loss for Dense Object Detection
原文链接如下:https://blog.csdn.net/JNingWei/article/details/80038594https://blog.csdn.net/weixin_41665360/article/details/90039317https://blog.csdn.net/weixin_30856725/article/details/951570731、目标检测...转载 2019-11-19 16:45:49 · 415 阅读 · 0 评论 -
YOLO v2网络结构分析
原论文网址:《YOLO9000: Better, Faster, Stronger》项目地址:http://pjreddie.com/darknet/yolo/1.Darknet-19模型结构2.YOLO v2模型结构YOLO2网络中第0-22层是Darknet-19网络,后面第23层开始,是添加的检测网络。说明:route层的作用是进行层的合并 ...转载 2019-11-18 11:49:18 · 14101 阅读 · 2 评论 -
YOLO v3网络结构分析
1.Darknet-53 模型结构在论文中虽然有给网络的图,但我还是简单说一下。这个网络主要是由一系列的1x1和3x3的卷积层组成(每个卷积层后都会跟一个BN层和一个LeakyReLU)层,作者说因为网络中有53个convolutional layers,所以叫做Darknet-53(2 + 1*2 + 1 + 2*2 + 1 + 8*2 + 1 + 8*2 + 1 + 4*2 + 1 = 5...转载 2019-11-18 10:47:06 · 3622 阅读 · 0 评论 -
使用Keras实现多分类输出multi-class classification(两种网络结构)
如何让一个网络同时分类一张图像的两个独立标签?一般我们会构建一个输出网络,每一个label作为属性输出;或者构建两个分支网络,针对不同label输出。1、数据集组成(fashion)本人的数据集有12类,共计5547张图片。其中有6类是从网上下载获取的,剩余的6类是自己在网上爬虫分类整理得到的。该数据集主要是有两类信息:颜色(黑色、红色、蓝色、白色)和服饰类型(牛仔裤、连衣裙、短袖...原创 2019-11-13 16:48:58 · 3345 阅读 · 2 评论 -
Xception 算法
引言Xception是google在inception之后提出的对inceptionV3的另一种改进,主要采用depthwise separable convolution来替换原来的inception v3中的卷积操作。思考要解决什么问题?怎么解决的?探寻Inception的基本思路 从Inception发展历程的角度,理解其基本思想,并引入与Inception类似的Depth...转载 2019-11-12 11:15:10 · 1198 阅读 · 0 评论 -
人脸属性分析--性别、年龄和表情识别开源集合
人脸属性指的是根据给定的人脸判断其性别、年龄和表情等,当前在github上开源了一些相关的工作,大部分都是基于tensorflow的,还有一部分是keras,CVPR2015曾有一篇是用caffe做的。1、CVPR2015 caffe实现https://github.com/GilLevi/AgeGenderDeepLearning2、CVPR2015对应的tensorflow实现...原创 2019-11-08 12:40:34 · 2297 阅读 · 0 评论 -
DenseNet结构解读
1、网络结构与Inception系列和ResNet网络不通,Inception网络主要是从网络的宽度方面改进网络的结构从而提高网络的表达能力,而ResNet主要是从网络的深度方面改进网络的结构来提高表达能力,而DenseNet则是通过特征图重用的方式来探索网络的潜能。DenseNet让网络的每一层的输入变成所有前面层的叠加(concat),然后把它的特征图传递给所有接下来的网络层。传统...原创 2019-11-07 17:58:43 · 4883 阅读 · 0 评论 -
ResNet结构解读
ResNet在2015年被提出,在ImageNet比赛classification任务上获得第一名,因为它“简单与实用”并存,之后很多方法都建立在ResNet50或者ResNet101的基础上完成的,检测,分割,识别等领域都纷纷使用ResNet,Alpha zero也使用了ResNet,所以可见ResNet确实很好用。ResNet的意义: 随着网络的加深,出现了训练集准确率下...转载 2019-11-07 10:12:41 · 4106 阅读 · 0 评论 -
目标检测中的评价指标
目标检测中的评价指标如下: 准确率 (Accuracy),混淆矩阵 (Confusion Matrix),精确率(Precision),召回率(Recall),平均正确率(AP),mean Average Precision(mAP),交除并(IoU),ROC + AUC,非极大值抑制(NMS)。1、准确率 (Accuracy) 分对的样本数除以所有的样本数 ,即:准确(分类)率 ...转载 2019-10-31 09:23:06 · 770 阅读 · 0 评论 -
caffe中网络结构的可视化
在caffe中,网络结构文件(prototxt)的可视化,有两种方法。一种是Caffe里的工具 draw_net.py (该文件目录 $(CAFFE_ROOT)/python/ ),还有一种是在线网页生成。第一种方法使用如下:usage: draw_net.py [-h] [--rankdir RANKDIR] [--phase PHASE] input_net_proto_f...原创 2019-01-21 21:47:41 · 438 阅读 · 1 评论 -
YOLOV2原理详解
论文:YOLO9000:Better,Faster,Stronger论文地址:https://arxiv.org/abs/1612.08242原文链接:https://blog.csdn.net/u014380165/article/details/77961414 https://blog.csdn.net/lwplwf/article/deta...转载 2019-03-05 21:57:05 · 2080 阅读 · 0 评论 -
年龄预测(SSRNet)模型转换(Keras转Caffe)
原文链接:https://blog.csdn.net/lwplwf/article/details/84292743SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimationpaper:https://github.com/shamangary/SSR-Net/blob/master/ijcai18_ssrn...转载 2019-03-05 22:37:48 · 1416 阅读 · 3 评论 -
caffe学习率策略(lr_policy参数)选择方法
原文链接地址:https://blog.csdn.net/zong596568821xp/article/details/80917387在caffe源码的caffe-master/sec/caffe/proto/caffe.proto下记录了不同的学习策略的计算方法:// The learning rate decay policy. The currently implemented...转载 2019-03-21 11:07:50 · 1619 阅读 · 0 评论 -
训练集与测试集的loss之间关系说明
train loss 不断下降,test loss不断下降,说明网络仍在学习;train loss 不断下降,test loss趋于不变,说明网络过拟合;(max pool或者正则化)train loss 趋于不变,test loss不断下降,说明数据集100%有问题;train loss 趋于不变,test loss趋于不变,说明学习遇到瓶颈,需要减小学习率或批量数目;或者是数据集有...转载 2019-04-11 13:59:25 · 2381 阅读 · 4 评论 -
数据增强操作(旋转、翻转、裁剪、色彩变化、高斯噪声等)
# -*- coding:utf-8 -*-"""数据增强 1. 翻转变换 flip 2. 随机修剪 random crop 3. 色彩抖动 color jittering 4. 平移变换 shift 5. 尺度变换 scale 6. 对比度变换 contrast 7. 噪声扰动 noise 8. 旋转变换/反射变换 Rotation/refl...原创 2019-04-15 18:12:48 · 7439 阅读 · 2 评论 -
深度学习与机器学习教程
深度学习教程整理:https://github.com/zeusees/HyperDL-Tutorial机器学习教程整理:https://github.com/Avik-Jain/100-Days-Of-ML-Code(英文版)https://github.com/MLEveryday/100-Days-Of-ML-Code(中文版)...原创 2019-04-26 12:45:15 · 276 阅读 · 0 评论 -
CUDA对应的NVIDIA驱动版本对照表
一般而言,不同版本的CUDA要求不同的NVIDIA驱动版本,同时显卡驱动版本要不低于CUDA的安装版本,具体的对照关系如下:如下链接对应了官方的版本要求说明:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html一般安装显卡驱动版本一般有如下两种方式:前提需要查询对应直自己机器的显卡驱动版本,查询链接...原创 2019-05-21 17:33:44 · 94115 阅读 · 8 评论 -
深度学习中的卷积(conv)和空洞卷积(dilated conv)
原文链接:https://blog.csdn.net/CV_YOU/article/details/81633645关于常规的卷积和空洞卷积的差别简单解释如下:1.参数比较:构建一个卷积层,最核心的是卷积核的尺寸和stride的大小,而空洞卷积最核心的参数是卷积核尺寸和rate的大小.当stride=1时候,和rate=1是一样的效果.2.功能比较那什么时候会有区别呢,就是...转载 2019-07-15 11:11:15 · 2563 阅读 · 0 评论 -
caffe实现多标签分类模型
原文链接地址:https://www.jianshu.com/p/fdf7c599ab9d常规的基于CNN的图像分类网络如Lenet、Alexnet、VGGnet等都是单分类模型,本文记录在ubuntu16.04下如何对传统的单分类模型进行调整,实现多标签分类的效果,这里主要指的是对固定长度字符串的识别,相同原理可用于验证码识别和车牌识别。下面整理了使用caffe完成多标签分类(mu...转载 2019-07-16 14:16:43 · 890 阅读 · 0 评论 -
目标检测:PVAnet原理解析
原文:用于实时物体检测的深度轻量神经网络(PVANET:Deep but Lightweight Neural Networks for Real-time Object Detection)论文链接:http://arxiv.org/pdf/1608.08021Github:https://github.com/sanghoon/pva-faster-rcnnC++ Demo:htt...转载 2019-07-30 17:53:25 · 543 阅读 · 0 评论 -
深度学习训练时网络不收敛的原因分析总结
原文链接:https://blog.csdn.net/comway_Li/article/details/81878400为什么我训练网络的时候loss一直居高不下或者准确度时高时低,震荡趋势,一会到11,一会又0.1,不收敛。 又不知如何解决,博主总结了自己训练经验和看到的一些方法。首先你要保证训练的次数够多,不要以为一百两百次就会一直loss下降或者准确率一直提高,会有一点震荡的。只要...转载 2019-07-22 15:29:21 · 4024 阅读 · 1 评论 -
caffe自定义模型训练的方法
原文链接:https://blog.csdn.net/qq_30638831/article/details/81606380该文章详细记录了如何转换数据,如何利用其它模型文件修改,训练自己的网络,具有一定的借鉴意义。...原创 2019-02-20 22:57:28 · 499 阅读 · 0 评论 -
Caffe学习记录:Cifar-10 自定义网络训练记录
原文链接:https://blog.csdn.net/linj_m/article/details/49428601该博客详细记录了自定义网络结构的验证过程,非常值得学习和参考。原创 2019-02-20 22:29:20 · 158 阅读 · 0 评论 -
SENet(Squeeze-and-Excitation Networks)网络详解
论文:《Squeeze-and-Excitation Networks》论文链接:https://arxiv.org/abs/1709.01507 代码地址:https://github.com/hujie-frank/SENet PyTorch代码地址:https://github.com/miraclewkf/SENet-PyTorch原文链接:https://blog.csdn....转载 2019-02-20 22:00:30 · 11710 阅读 · 0 评论 -
目标检测 FPN:Feature Pyramid Networks for Object Detection
论文:Feature Pyramid Networks for Object Detection论文链接:https://arxiv.org/pdf/1612.03144.pdf开源链接:https://github.com/unsky/FPN原文链接:https://blog.csdn.net/fengbingchun/article/details/87359191 ...转载 2019-02-21 22:46:30 · 951 阅读 · 0 评论 -
准确率、精确率、召回率、F1值、ROC/AUC整理笔记
原文链接地址:https://blog.csdn.net/u013063099/article/details/80964865 加了部分修改对于二分类问题,机器预测的和实际的还是会有所偏差,所以我们引入以下几个概念来评价分类器的优良。一、TP、TN、FP、FN概念首先有关TP、TN、FP、FN的概念。大体来看,TP与TN都是分对了情况,TP是正类,TN是负类。则推断出,FP是把错...转载 2019-01-22 22:36:43 · 9033 阅读 · 1 评论 -
目标检测中的IOU计算问题
原文来源:https://blog.csdn.net/qq_17550379/article/details/78815637在目标检测中我们有一个基本的操作,形象表述就是画框框,我们要通过我们画的框把我们要标注的目标给框出来,如下面那个狗。我们既可以说这个狗被框出来了,但是也可以说没有,因为你可以观察到左边和上面是存在一些缝隙的。 那问题就出现了。什么样的框才算把目标给框住了呢?这个...转载 2019-01-22 21:48:33 · 2508 阅读 · 0 评论 -
caffemodel文件大小的计算
原文链接地址:https://blog.csdn.net/u014696921/article/details/52413561 caffemodel是训练过程中产生的文件,里面主要存放的是网络模型中各层的w和b参数,另外还存放网络形状等其它的一些信息。所以我们可以看到,caffemodel的大小主要取决于模型的w和b参数的数量。w和b参数的数量主要由下面的两个因素决定:...转载 2019-01-27 11:19:05 · 651 阅读 · 0 评论 -
在Caffe中自定义Layer:矩阵相乘Matmul
原作者链接如下:https://blog.csdn.net/feifei884431/article/details/52232381原创 2019-01-21 22:15:01 · 1872 阅读 · 0 评论 -
caffe中的矩阵操作函数
转载来源:https://blog.csdn.net/z13653662052/article/details/805167481. caffe_cpu_gemm 函数: 2. caffe_cpu_gemv 函数: 3.caffe_axpy 函数: 4.caffe_set 函数: 5.caffe_add_scalar 函数: 6.caffe_copy 函数: 7.caffe_sca...转载 2019-01-21 21:58:54 · 472 阅读 · 0 评论 -
open_nsfw: 雅虎基于Caffe的成人图片识别模型
nsfw(Not suitable for work classifier)是雅虎开源的进行色情检测识别的一个网络,该网络基于Resnet50修改,取得了非常不错的色情检测效果。开源地址:https://github.com/yahoo/open_nsfw在安装好caffe后,具体测试demo 如下:cd open_nsfwpython ./classify_nsfw.py \-...原创 2019-01-21 21:07:40 · 5220 阅读 · 0 评论 -
人脸特征点检测——Tweaked CNN(TCNN)
《Facial Landmark Detection with Tweaked Convolutional Neural Networks》论文链接:https://talhassner.github.io/home/publication/2017_TPAMI_2开源参考项目: https://github.com/cooparation/...转载 2019-01-26 17:48:53 · 1176 阅读 · 0 评论 -
人脸检测——Multi-task CNN(MTCNN)
论文连接:https://kpzhang93.github.io/MTCNN_face_detection_alignment/开源代码:https://github.com/kpzhang93/MTCNN_face_detection_alignment或者参考其他:https://github.com/BigcowPeking/mtcnn-caffe ...转载 2019-01-26 16:49:35 · 1520 阅读 · 0 评论