深度学习
文章平均质量分 91
kk123k
这个作者很懒,什么都没留下…
展开
-
神经网络和深度学习(一)
原创博客,转载请注明出处!1、欢迎来到深度学习的课程深度学习改变了传统互联网业务,例如如网络搜索和广告。但是深度学习同时也使得许多新产品和企业以很多方式帮助人们,从获得更好的健康关注。2、什么是神经网络?深度学习指的是训练神经网络,有时候规模很大!让我们从一个房价预测的例子开始讲起。假设你有一个数据集,它包含了六栋房子的信息。所以,你知道房屋的面积是多少平方英尺或者平方米,...原创 2018-12-27 09:56:58 · 256 阅读 · 0 评论 -
Fast R-CNN论文详解
R-CNN出来以后,首次将卷积神经网络带入目标检测领域。随着SPP-Net等的出现对它的改进,受SPP-Net的启发,Fast R-CNN出现了。Fast R-CNN和R-CNN相比,训练时间从84小时减少为9.5小时,测试时间从47秒减少为0.32秒。在PASCAL VOC 2007上的准确率相差无几,约在66%-67%之间。一.Fast R-CNN所解决R-CNN的两个问题1、...原创 2019-01-17 23:42:24 · 1228 阅读 · 0 评论 -
YOLO v2详解
YOLO v2和YOLO9000是同一篇论文提出的两个模型,二者略有不同。前者主要是YOLO的升级版,比YOLO拥有更高的精度和速度,后者的主要检测网络也是YOLO v2,同时对数据集做了融合,使用联合训练算法,使得模型可以检测9000多类物体。 一、Better(更准)YOLO 一代有很多缺点,作者希望改进的方向是改善 recall,提升定位的准确度,同时保持分类的准确度。...原创 2019-01-23 21:58:32 · 3456 阅读 · 0 评论 -
序列模型(三)
本周讲的是序列模型和注意力机制1、基础模型在这一周,你将会学习seq2seq(sequence to sequence)模型,从机器翻译到语音识别,它们都能起到很大的作用,从最基本的模型开始。之后你还会学习集束搜索(Beam search)和注意力模型(Attention Model),一直到最后的音频模型,比如语音。比如你想通过输入一个法语句子,比如这句 “Jane visite I...原创 2019-01-08 11:51:48 · 1134 阅读 · 0 评论 -
Faster R-CNN详解
自R-CNN以及Fast R-CNN的出现之后,Fast R-CNN仍然有许多缺点,即选择性搜索找出所有的候选框这个也非常耗时,因此性能存在瓶颈,为了解决这个问题,Faster R-CNN就出现了。解决:加入一个提取边缘的神经网络,也就说找到候选框的工作也交给神经网络来做了。做这样的任务的神经网络叫做Region Proposal Network(RPN)。基本做法: • 将RPN放...转载 2019-01-20 11:17:35 · 12848 阅读 · 0 评论 -
RoIPooling与RoIAlign的区别
一、RoIPooling与RoIAlign1.1、RoIPooling通过对Faster RCNN的学习我妈了解的RolPooling可以使生成的候选框region proposal映射产生固定大小的feature map先贴出一张图,接着通过这图解释RoiPooling的工作原理 针对上图 1)Conv layers使用的是VGG16,feat_stride=3...转载 2019-01-20 20:55:05 · 13852 阅读 · 1 评论 -
FPN网络详解
特征图金字塔网络FPN(Feature Pyramid Networks)是2017年提出的一种网络,FPN主要解决的是物体检测中的多尺度问题,通过简单的网络连接改变,在基本不增加原有模型计算量的情况下,大幅度提升了小物体检测的性能。低层的特征语义信息比较少,但是目标位置准确;高层的特征语义信息比较丰富,但是目标位置比较粗略。另外虽然也有些算法采用多尺度特征融合的方式,但是一般是采用融合后的特...原创 2019-01-21 11:39:28 · 70758 阅读 · 10 评论 -
图像分类、目标检测、语义分割、实例分割和全景分割的区别
计算机视觉的任务很多,有图像分类、目标检测、语义分割、实例分割和全景分割等,那它们的区别是什么呢?1、Image Classification(图像分类)图像分类(下图左)就是对图像判断出所属的分类,比如在学习分类中数据集有人(person)、羊(sheep)、狗(dog)和猫(cat)四种,图像分类要求给定一个图片输出图片里含有哪些分类,比如下图的例子是含有person、sheep和do...原创 2019-01-22 14:04:02 · 25993 阅读 · 7 评论 -
Mask R-CNN详解
一、Mask R-CNN网络介绍Mask R-CNN是何凯明2017年提出的一个实例分割(Instance segmentation)算法,可以用来做“目标检测”、“目标实例分割”、“目标关键点检测”。,是ICCV2017的best paper。Mask R-CNN网络的设计比较简单,①在Faster R-CNN的基础上,在原本的两个分支上(分类+坐标回归)增加一个简单的完全卷积网络...原创 2019-01-22 14:12:33 · 3042 阅读 · 1 评论 -
YOLO v3代码学习
本人使用的版本是https://github.com/AlexeyAB/darknet源码在darknet-master\src目录下 还记得我们用YOLO v3训练自己的数据集的过程,控制台下使用以下代码进行训练darknet.exe detector train data/obj.data yolo-obj.cfg darknet53.conv.74上面代码的意...原创 2019-02-01 15:06:47 · 3286 阅读 · 3 评论 -
R-CNN论文详细解读
R-CNN是13年https://arxiv.org/abs/1311.2524的论文。对计算机视觉的影响很大!基础知识掌握:①先来简单区分计算机视觉的任务:简单来说,分类(classify)、定位(localization)和检测(detection)的区别如下: classify:是什么? localization:在哪里?是什么?(单个目标) detection:在哪里?分别...原创 2019-01-16 23:19:54 · 3901 阅读 · 0 评论 -
YOLO详解
原创博客,转载请注明出处!YOLO(You Only Look Once)是2016年提出的一篇关于目标检测比较有名的文章。其以速度快和泛化能力强为优点。在YOLO之后,又改进出了YOLO-v2、YOLO-v3,v2、v3的精度相比v1有了很大的提升,这个后面再详细介绍。本文介绍的YOLO第一版。1、直观理解YOLOYOLO直接采用regression(回归)的方法进行坐标框的检测以及...原创 2019-01-23 09:23:23 · 16882 阅读 · 1 评论 -
YOLO v3详解
YOLO v3是YOLO和YOLO v2之后的YOLO系列的又一篇目标检测算法,是基于YOLO v2的一个改进,速度更快,精度更高! 1、YOLO v3的网络结构图其中:DBL:如图1左下角所示,也就是代码中的Darknetconv2d_BN_Leaky,是yolo_v3的基本组件。就是卷积+BN+Leaky relu。对于v3来说,BN和leaky relu已经是和卷积...原创 2019-01-29 21:53:14 · 26009 阅读 · 0 评论 -
卷积神经网络(一)
本周讲的是卷积神经网络1、计算机视觉深度学习之所以让我兴奋有下面两个原因,我想你们也是这么想的。第一,计算机视觉的高速发展标志着新型应用产生的可能,这是几年前,人们所不敢想象的。通过学习使用这些工具,你也许能够创造出新的产品和应用。其次,即使到头来你未能在计算机视觉上有所建树,但我发现,人们对于计算机视觉的研究是如此富有想象力和创造力,由此衍生出新的神经网络结构与算法,这实际上启发...原创 2019-01-03 11:44:48 · 1305 阅读 · 0 评论 -
结构化机器学习项目(二)
原创博客,转载请注明出处!本周讲的是机器学习(ML)策略(2)1、进行误差分析如果你希望让学习算法能够胜任人类能做的任务,但你的学习算法还没有达到人类的表现,那么人工检查一下你的算法犯的错误也许可以让你了解接下来应该做什么。这个过程称为错误分析,我们从一个例子开始讲吧。假设你正在调试猫分类器,然后你取得了90%准确率,相当于10%错误,,在你的开发集上做到这样,这离你希望的目标还有...原创 2019-01-02 17:56:52 · 683 阅读 · 0 评论 -
SPP-Net论文详解
自R-CNN出来以后受到了广大的关注和研究,并设法将其优化,解决R-CNN的一些缺点,于是SPP-Net 就出来了。SPP-Net总体框架图如下该文章主要改进了以下两点:1、CNN需要固定输入图像的尺寸,导致不必要的精度损失2、R-CNN对候选区域进行重复卷积计算,造成计算冗余 1、为什么CNNs要固定输入图像的尺寸?深度卷积神经网络的基础结构分为:卷积层(conv lay...原创 2019-01-17 11:44:03 · 1062 阅读 · 0 评论 -
神经网络和深度学习(二)
原创博客,转载请注明出处!本周的主题是神经网络基础1、二分分类逻辑回归是一个用于二分类的算法。首先我们从一个问题开始说起,这里有一个二分类问题的例子,假如你有一张图片作为输入,比如这只猫,如果识别这张图片为猫,则输出标签1作为结果;如果识别出不是猫,那么输出标签0作为结果。现在我们可以用字母 y 来 表示输出的结果标签,如下图所示:我们来看看一张图片在计算机中是如何表示的,为...原创 2018-12-27 16:15:38 · 441 阅读 · 0 评论 -
神经网络和深度学习(三)
原创博客,转载请注明出处!本周讲的是浅层神经网络1、神经网络概览我们开始快速浏览一下如何实现神经网络。上周我们讨论了逻辑回归,我们了解了这个模型而神经网络却需要反复计算z和a,最后计算损失函数L逻辑回归中,有一些从后向前的计算用来计算导数 da 、 dz 。同样,在神经网络中我们也有从后向前的计算! 2、神经网络表示本节讨论神经网络图片的具体含义输入特征被竖...原创 2018-12-28 15:35:45 · 777 阅读 · 0 评论 -
神经网络和深度学习(四)
原创博客,转载请注明出处!本周讲的是深层神经网络1、深层神经网络目前为止我们学习了只有一个单独隐藏层的神经网络的正向传播和反向传播,还有逻辑回归,并且你还学到了向量化,这在随机初始化权重时是很重要。本周所要做的是把这些理念集合起来,就可以执行你自己的深度神经网络。注意,神经网络的层数是这么定义的:从左到右,由0开始定义,严格上来说逻辑回归也是一个一层的神经网络。有一个隐藏层...原创 2018-12-28 19:24:52 · 251 阅读 · 0 评论 -
改善深层神经网络:超参数调试、正则化以及优化(一)
原创博客,转载请注明出处!本周讲的是深度学习的实用层面1、训练/开发/测试集本周我们继续学习如何有效运作神经网络,内容涉及超参数调优,如何构建数据,以及如何确保优化算法快速运行,从而使学习算法在合理时间内完成自我学习。我们首先说说神经网络机器学习中的问题,然后是随机神经网络,还会学习一些确保神经网络正确运行的技巧,带着这些问题,我们开始今天的课程。在配置训练、验证和测试数据集的...原创 2018-12-29 17:41:28 · 770 阅读 · 0 评论 -
卷积神经网络(二)
本周讲的是深度卷积网络:实例探究1、为什么要进行实例探究这周我们首先来看看一些卷积神经网络的实例分析,为什么要看这些实例分析呢?上周我们讲了基本构建,比如卷积层、池化层以及全连接层这些组件。事实上,过去几年计算机视觉研究中的大量研究都集中在如何把这些基本构件组合起来,形成有效的卷积神经网络。最直观的方式之一就是去看一些案例,就像很多人通过看别人的代码来学习编程一样,通过研究别人构建有效组件...原创 2019-01-03 18:02:20 · 4533 阅读 · 0 评论 -
卷积神经网络(三)
本周讲的是目标检测1、目标定位对象检测是计算机视觉领域中一个新兴的应用方向,相比前两年,它的性能越来越好。在构建对象检测之前,我们先了解一下对象定位,首先我们看看它的定义。图片分类任务我们已经熟悉了,就是算法遍历图片,判断其中的对象是不是汽车,这就是图片分类。这节课我们要学习构建神经网络的另一个问题,即定位分类问题。这意味着,我们不仅要用算法判断图片中是不是一辆汽车,还要在图片中标...原创 2019-01-04 11:36:27 · 1061 阅读 · 0 评论 -
卷积神经网络(四)
本周讲的是特殊应用:人脸识别和神经风格转换1、什么是人脸识别?你学了很多卷积神经网络的知识。我这周准备向你展示一些重要的卷积神经网络的特殊应用,我们将从人脸识别开始,之后讲神经风格迁移,你将有机会在编程作业中实现这部分内容,创造自己的艺术作品。在人脸识别的相关文献中,人们经常提到人脸验证(face verification)和人脸识别(face recognition)。这是人脸验...原创 2019-01-04 17:51:13 · 1079 阅读 · 0 评论 -
改善深层神经网络:超参数调试、正则化以及优化(二)
原创博客,转载请注明出处!本周讲的是优化算法1、Mini-batch梯度下降法本周将学习优化算法,这能让你的神经网络运行得更快。机器学习的应用是一个高度依赖经验的过程,伴随着大量迭代的过程,你需要训练诸多模型,才能找到合适的那一个,所以,优化算法能够帮助你快速训练模型。其中一个难点在于,深度学习没有在大数据领域发挥最大的效果,我们可以利用一个巨大的数据集来训练神经网络,而在巨大的数...原创 2018-12-31 19:50:41 · 560 阅读 · 0 评论 -
序列模型(一)
本周讲的是循环序列模型1、为什么选择序列模型在本课程中你将学会序列模型,它是深度学习中最令人激动的内容之一。循环神经网络(RNN)之类的模型在语音识别、自然语言处理和其他领域中引起变革。在本节课中,你将学会如何自行创建这些模型。我们先看一些例子,这些例子都有效使用了序列模型。在进行语音识别时,给定了一个输入音频片段 X ,并要求输出对应的文字记录 Y 。这个例子里输入和输出数据都是...原创 2019-01-05 16:53:42 · 1960 阅读 · 0 评论 -
改善深层神经网络:超参数调试、正则化以及优化(三)
原创博客,转载请注明出处!本周讲的是超参数调试、Batch正则化和程序框架1、调试处理本节我想和你分享一些指导原则,一些关于如何系统地组织超参调试过程的技巧。关于训练深度最难的事情之一是你要处理的参数的数量,结果证实一些超参数比其它的更为重要,我认为,最为广泛的学习应用是α,学习速率是需要调试的最重要的超参数。吴恩达老师认为红色圈住的最重要,其次黄色,最后紫色除了α,还...原创 2019-01-01 21:22:27 · 1387 阅读 · 0 评论 -
序列模型(二)
本周讲的是自然语言处理与词嵌入1、词汇表征上周我们学习了RNN、GRU单元和LSTM单元。本周你会看到我们如何把这些知识用到NLP上,用于自然语言处理,深度学习已经给这一领域带来了革命性的变革。其中一个很关键的概念就是词嵌入(word embeddings),这是语言表示的一种方式,可以让算法自动的理解一些类似的词,比如男人对女人,比如国王对王后,还有其他很多的例子。通过词嵌入的概念你就可...原创 2019-01-06 18:07:50 · 865 阅读 · 2 评论 -
结构化机器学习项目(一)
原创博客,转载请注明出处!本周讲的是机器学习(ML)策略(1)1、为什么是ML策略?如何构建你的机器学习项目也就是说机器学习的策略。我希望通过这门课程你们能够学到如何更快速高效地优化你的机器学习系统。那么,什么是机器学习策略呢?我们从一个启发性的例子开始讲,假设你正在调试你的猫分类器,经过一段时间的调整,你的系统达到了90%准确率,但对你的应用程序来说还不够好。你可能有很多...原创 2019-01-02 11:38:57 · 600 阅读 · 0 评论 -
win10下YOLO v3训练自己的数据集
一、YOLO v3的下载与编译1、安装VS(YOLOv3支持vs2012、2013、2015,其他版本需要下载工具集) 去https://visualstudio.microsoft.com/downloads/?lang=en下载vs,YOLOv3支持vs2012、2013、2015,其他版本需要下载工具集(本人使用VS2017),下载工具集步骤:在电脑搜索框输入vi,点击Vi...原创 2019-01-30 20:08:07 · 21305 阅读 · 48 评论