飞桨学习篇(8.18)

8.18学习笔记

计算机视觉

图像识别的基本框架:测量空间—(特征表示)—特征空间——类别空间

特征表示:设计特征

深度学习:学习特征

早期图像识别方法

用全局的视觉底层特性统计量表示图像

中期图像处理方法

局部特征被转化为视觉关键词,图片被标示成视觉词袋

局部检测子:Harris,DoG,SURF,Harris-Affine,and MSER

局部描述子:SIFT,PCA-SIFT,GLOH,Shape Context,ORB,COGE

传统方法:人工特征提取+分类器

深度学习:模拟人类的视觉系统,从原始信号,做低级抽象,逐渐向高级抽象迭代

深度学习起源与发展

1958 perceptron(神经元)被提出

1998 LeNet应用在MINST完成手写数字识别

2012 AlexNet夺冠ImageNet

卷积神经网络(Convolutional Neural Networks, CNN)是计算机视觉技术最经典的模型结构。卷积、池化、激活函数、批归一化、Dropout丢弃法等。

图像分类:介绍图像分类算法的经典模型结构,包括:LeNet、AlexNet、VGG、GoogLeNet、ResNet,并通过眼疾筛查的案例展示算法的应用。

目标检测:介绍目标检测YOLO-V3算法,并通过林业病虫害检测案例展示YOLO-V3算法的应用。

卷积具体形式:b[i,j] =a[i+u,j+v]*w[u,v]

b输出图片,a输入图片(H x W),u为卷积核(kh x kw)

输出图片尺寸:

Hout = H – Kh + 1

Wout = W – Kw + 1

填充(Ph,Pw保证图片前后大小一致)

Ph = (Kh-1)/2, Pw = (kw-1)/2

卷积的特点:

1)图片不同区域共用卷积核

2)卷积操作保留了空间信息

3)卷积核参数的个数与输入图片大小无关

多输入和多输出通道:

输入【   N,Cin,Hin,Win】输出【N,Cin,Hin,Win】N表示图片数

 

池化:使用某一位置的相邻输出的总体统计特征来代替网络在该位置的输出

平均池化 最大池化

  1. 数据微小变化时保证输出不变
  2. 特征图变小,减小神经元的个数,节省存储空间提高效率,减少过拟合

池化参数(没有学习参数,通道数不变独立池化)

池化窗口大小Pool_size [kh,kw]

池化窗口滑动步幅Pool_stride[stride_h,stride_w]

图片填充:padding = [ph,pw] 常见设置参数 2 2 2 2 0 0 使长宽减半

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值