卷积神经网络（简单理解）

最新推荐文章于 2024-07-12 11:45:29 发布

该学就学，该摆就摆

最新推荐文章于 2024-07-12 11:45:29 发布

阅读量632

点赞数

分类专栏：机器学习 cnn 文章标签：神经网络深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52122740/article/details/120106633

版权

机器学习同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1 为什么用卷积神经网络？

在计算机视觉方面，由于人眼无法识别大量图片数据并且无法准确判断物体，所以运用卷积神经网络便可以实现一些监测任务和追踪，分类和检索（类似淘宝拍同款），医学任务（细胞识别），但凡跟图像识别有关的都可以运用。

2 与传统神经网络的区别

传统网络大多都是二维的，而卷积神经网络则是三维层面。

3 整体架构

<1>输入层

<2>卷积层

<3>池化层

<4>全连接层

图中数字7对方框内进行一系列操作正如图。输入层就是输入不做解释

<2>卷积层：

将图像进行分割，再对每个小区域进行操作

如图对小方框1进行操作，得到蓝色5*5方框（三维，深度不变故不表现），接下来就是得到每3*3的特征值然后得到图中绿色方框，绿色方框小数表示权重，权重*大数字=特征值

图像颜色通道：

将图像拆解成RGB三色

卷积就是将R G B三种进行特征提取然后得到整个立体图

图中图像为7*7*3的，左边第一张可以为R，第二张为G，第三张为B，左边对应每个区域对应相乘红色框然后相加，如0*1+0*1+0*1+0*-1+1*-1+0*1+0*-1+1*1+0*0（左边第一个方框乘红色）+0*-1+0*-1+。。。。+1（bias值）=3（绿色方框第一个），bias（偏置项），偏置值必须加不能忘，后面的绿色方框就是特征图（3*3*2）两层，特征图越多特征越丰富，为什么原始数据是5*5而图上数据是7*7添加数据为0（边缘填充）？就是因为0不会影响数字结果，若添加为1，那么特征值变换较大，卷积可以多做几步，提取不同程度的特征，（注：后面的卷积在提取到的第一次特征图上在进行卷积）

卷积层涉及参数：

步长：图片步长最好设为1，若得到部分有超出范围的影响也不大

卷积核尺寸：一般为3*3

边界填充如上：

卷积计算公式如上：

如果输入数据是32*32*3的图像，用10个5*5*3的filter来进行卷积操作，指定步长为1，边界填充为2，最终输入的规模为多少？

答：（32-5+2*2）/1 + 1 = 32，所以输出规模为32*32*10，经过卷积操作后也可以保持长度，宽度不变。

卷积参数共享：

<2>池化层

特征个数进行压缩得到原来的一半（长和宽），图中红色框选最大的值，因为最大的值比较重要，代表的特征较为明显，即最大池化

特征图变化：最后得到输出

卷积神经网络具体查看【计算机博士唐宇迪居然半天教会了我4年没学会的计算机视觉】CNN/OpenCV/Python/PyTorch（附带课程课件资料+课件笔记+源码）_哔哩哔哩_bilibili

该学就学，该摆就摆

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
卷积神经网络（简单理解）

1 为什么用卷积神经网络？在计算机视觉方面，由于人眼无法识别大量图片数据并且无法准确判断物体，所以运用卷积神经网络便可以实现一些监测任务和追踪，分类和检索（类似淘宝拍同款），医学任务（细胞识别），但凡跟图像识别有关的都可以运用。2 与传统神经网络的区别传统网络大多都是二维的，而卷积神经网络则是三维层面。3 整体架构 <1>输入层 <2>卷积层 <3>池化层 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。