卷积神经网络(简单理解)

1 为什么用卷积神经网络?

        在计算机视觉方面,由于人眼无法识别大量图片数据并且无法准确判断物体,所以运用卷积神经网络便可以实现一些监测任务和追踪,分类和检索(类似淘宝拍同款),医学任务(细胞识别),但凡跟图像识别有关的都可以运用。

2 与传统神经网络的区别

        传统网络大多都是二维的,而卷积神经网络则是三维层面。

 3 整体架构

        <1>输入层

        <2>卷积层

        <3>池化层

        <4>全连接层

 图中数字7对方框内进行一系列操作正如图。输入层就是输入不做解释

        <2>卷积层:

                        将图像进行分割,再对每个小区域进行操作

                        

 如图对小方框1进行操作,得到蓝色5*5方框(三维,深度不变故不表现),接下来就是得到每3*3的特征值然后得到图中绿色方框,绿色方框小数表示权重,权重*大数字=特征值

图像颜色通道:

        将图像拆解成RGB三色

 卷积就是将R   G   B三种进行特征提取然后得到整个立体图

 图中图像为7*7*3的,左边第一张可以为R,第二张为G,第三张为B,左边对应每个区域对应相乘红色框然后相加,如0*1+0*1+0*1+0*-1+1*-1+0*1+0*-1+1*1+0*0(左边第一个方框乘红色)+0*-1+0*-1+。。。。+1(bias值)=3(绿色方框第一个),bias(偏置项),偏置值必须加不能忘,后面的绿色方框就是特征图(3*3*2)两层,特征图越多特征越丰富,为什么原始数据是5*5而图上数据是7*7添加数据为0(边缘填充)?就是因为0不会影响数字结果,若添加为1,那么特征值变换较大,卷积可以多做几步,提取不同程度的特征,(注:后面的卷积在提取到的第一次特征图上在进行卷积)

 卷积层涉及参数:

 步长:图片步长最好设为1,若得到部分有超出范围的影响也不大

卷积核尺寸:一般为3*3

边界填充如上:

 卷积计算公式如上:

 如果输入数据是32*32*3的图像,用10个5*5*3的filter来进行卷积操作,指定步长为1,边界填充为2,最终输入的规模为多少?

        答:(32-5+2*2)/1 + 1 = 32,所以输出规模为32*32*10,经过卷积操作后也可以保持长度,宽度不变。

卷积参数共享:

 <2>池化层

 特征个数进行压缩得到原来的一半(长和宽),图中红色框选最大的值,因为最大的值比较重要,代表的特征较为明显,即最大池化

        

 特征图变化:最后得到输出

卷积神经网络 具体查看【计算机博士唐宇迪居然半天教会了我4年没学会的计算机视觉】CNN/OpenCV/Python/PyTorch(附带课程课件资料+课件笔记+源码)_哔哩哔哩_bilibili

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值