自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

转载 如何防止过拟合?二分类转换到多分类的方法?梯度消失/爆炸

数据增强:让模型看见尽可能多的例外情况。方法:从源头获取更多数据,对图像进行平移,翻转,缩放,亮度变化等使用简单的模型:减少网络的层数,神经元个数,等。提前结束训练。当时间较短时,网络权直较小,激活函数工作在线性区,当训练时间越长,部分权直越大。正则化限制权直:L1,L2增加噪声:在输入中加噪声,噪声会按照权直的平方放大。在权值上加噪声:0均值高斯分布初始化权直。对网络的响应加噪声:输出...

2018-04-17 18:12:51 1118

转载 语义分割发展史

在深度学习应用到计算机视觉领域之前,研究人员一般使用纹理基元森林(TextonForest)或是随机森林(Random Forest)方法来构建用于语义分割的分类器。卷积神经网络(CNN)不仅能很好地实现图像分类,而且在分割问题中也取得了很大的进展。最初,图像块分类是常用的深度学习方法,即利用每个像素周围的图像块分别将各像素分成对应的类别。其中,使用图像块的主要原因是分类网络通常具有全连接...

2018-03-29 10:36:57 4562 2

原创 卷积神经网络的发展史

LeNet:第一个成功的卷积神经网络应用AlexNet:类似LeNet,但更深更大。使用了层叠的卷积层来抓取特征(通常是一个卷积层马上一个max pooling层)ZF Net:增加了中间卷积层的尺寸,让第一层的stride和filter size更小。GoogLeNet(Inception):减少parameters数量,最后一层用max pooling层代替了全连接层。VGGNet:...

2018-03-28 17:05:03 1124 1

原创 FCN和RPN两种特征提取框架的区别

场景文本检测的难点主要在于目标的方向、形状、尺度变化显著,且自然场景背景复杂。现有的基于深度学习的场景文本检测框架大致分为两类: 一类基于FCN框架提取文本显著图,但此类方法引入大量噪声干扰结果准确性(因为最后要上采样匹配),需对显著图进行后处理(如:反卷积),无法实现端到端; 一类基于RPN框架提取proposal进行分类,但文本目标形状、方向、尺度的变化将proposal的...

2018-03-28 13:30:42 2657

原创 特征金字塔网络(Feature Pyramid Networks)

最开始的特征提取:图片有多种形式的分辨率或者大小,最开始的特征提取时分别在不同分辨率或者不同大小的情况下,分别提取特征进行预测接着人们只使用一个单个scale的预测,特征经过最终的提取后,达到最高级后,进行预测再然后人们对各个层的特征均进行预测形成一个自上而下或横向连接的结合(Top-down 是2x的下采样,横向连接时1*1conv)...

2018-03-27 15:14:54 1152

原创 目标检测与识别

0:机器学习 分类: 1:LeNet-5:6万个参数 2:AlexNet:6000万个参数 创新点:(1)训练处最大规模的CNN,此前LeNet-5仅包含3个卷积层和1个全连接层,它有8个权重层(5个卷积层,3个全连接层) (2)使用众多的skills,如dropout解决过拟合,Relu使得该网络在6000万个参数扔能收敛 3:VGG:没有...

2018-03-26 11:19:39 640

原创 深度学习基本概念

卷积的含义:一个函数(输入)在另一个函数(加权函数)上的加权叠加,得到的函数为输出随时间变化的函数,可以用来做特征提取batchsize:每批处理的数据数目 eporch:迭代次数 ReLU,Sigmoid,Softmax均为激活函数,比如Softmax输出类标签分布后,与真实类标签分布构成交叉熵(交叉熵反映了相似程度),即softnax交叉熵损失函数。端到端的模型:模型从原始输入到...

2018-03-26 11:08:08 802

原创 Mask R-CNN

segmentaion mask:分割掩模。 图像掩模的概念为用选定的图像、图形或物体,对待处理的图像(全部或局部)进行遮挡,来控制图像处理的区域或处理过程。用于覆盖的特定图像或物体称为掩模或模板。图像掩模主要用于:①提取感兴趣区,用预先制作的感兴趣区掩模与待处理图像相乘,得到感兴趣区图像,感兴趣区内图像值保持不变,而区外图像值都为0。即相当于特征的功能。Mask R-CNN 简介 它是一...

2018-03-21 15:57:32 527

转载 Semantic Segmentation(语义分割)

end-to-end training(端对端的训练):输入的是原始数据,输出的是最后的结果,假如输入的是提取后的特征或者是降维,分割之后图像输入则不是端对端,机器学习中的难点是特征的选择和提取,而端对端网络则能够自己提取特征,典型的用于语义分割的代表FCN,YOLO。CNN本质的作用还是用来分类,定位的功能其并没有做到。而yolo这种方法就是只通过CNN网络,就能够实现目标的定位和识别。也就是...

2018-03-18 16:46:33 790

转载 Tensorflow入门笔记

新建计算图 g1 = tf.Graph,可以通过tf.Graph.device函数来指定运行计算的设备。从而为使用GPU提供了机制。 g=tf.Graphwith g.device("/gpu:0"): result =a+b创建会话来得到张量的计算结果,只要把所有的计算放在“with”内部就可以 with tf.Session() as s...

2018-03-05 11:10:32 151

转载 深层神经网络

1.传统机器学习算法:输入–人工特征提取–权重学习–预测结果。2.深度学习:输入–基础特征提取(像素)–多层复杂特征提取(线条,轮廓–简单形状–复杂形状)–权重学习–预测结果3.特点:多层非线性 非线性(通过激活函数实现) 多层(解决异或问题,从而有组合特征提取的功能)4.神经网络优化算法:梯度下降算法(在全部训练数据上最小化损失,不一定为全局最优)随机梯度下降(随机优化某一条训练...

2018-03-05 11:10:03 260

原创 概念

人工智能包括机器学习,模式识别等很多方面,机器学习又分为符号机器学习,统计机器学习,深度学习(注重模型,通过数据来获得模型的参数),强化学习(操控机器人,行为规划,抓取)机器学习:(1)定义:研究在计算机上从数据中产生模型的算法,即‘学习算法’,有了该学习算法,从以往的经验(即数据)中产生模型,从而在新的情况时,模型给出判断(例:一个新瓜判断出是否好坏)。(2)特点:分类规则机器自动学习,即通...

2017-08-10 14:43:10 233

转载 bit.ly思路

open(path).readline()读取某个文件的一行,open(path).readlines()读取文件的所有行若文件为json格式(前提),则可以通过json.loads函数逐行加载数据,将json字符串转换成python字典对象import jsonrecords=[json.loads(line) for line in open(path)]#[]表示records为序列,只

2017-08-06 15:44:40 5974

原创 MovieLens 思路

将数据文件读取到pandas DataFrame对象中,比如user.dat文件的格式为:UserID::Gender::Age::Occupation::Zip-code,通过pandas.read_table 来实现import pandas as pdunames=['user_id','gender','age','occupation','zip']users=pd.read_tab

2017-08-02 23:09:23 958

转载 Python爬虫进阶四之PySpider的用法

查看anaconda里面已经安装了哪些库:conda list在anaconda里装sth库:conda install sthanaconda里面的python和本地电脑安装的python不是同一个,所以只需要一个即可,所以在anaconda里安装的库不能和本地电脑安装的Python库共用pip是一个用来安装库的库,anaconda中已经预装了pip,所以可以直接使用,所以在anaconda

2017-07-18 10:58:10 974

转载 数据分析2-1

打开文件:path=’E:/usagov_bitly_data2012-03-16-1331923249.txt’open(path).readline():查看文件的第一行Json模块:使Json字符串转换成Python字典对象: import json path = 'ch02/usagov_bitly_data2012-03-16-1331923249.txt' records =

2017-07-17 13:06:00 256

转载 记于崔庆才爬虫1-2

Python3跟Python2的区别: 1:只有print()函数,没有print函数 2:只有range()函数,没有arange()函数hasattr(object(对象),name(属性)):检查给定的对象是否有指定的属性#coding=utf-8:用于整个代码开头,表示代码全局不管是编码还是解码都用的utf-8形式re.S 标志代表在匹配时为点任意匹配模式,点 . 也可以代表换行

2017-07-14 15:01:03 536

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除