吴恩达CNN之三维卷积

霖大侠

于 2024-03-12 07:00:00 发布

阅读量517

点赞数 9

文章标签： cnn 深度学习人工智能神经网络计算机视觉卷积神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51659249/article/details/136624256

版权

本文介绍了在RGB图像上进行卷积操作，包括3D卷积核的使用、卷积计算过程以及单层卷积网络与非卷积网络的区别。重点讨论了卷积神经网络如何通过共享参数处理不同尺寸图像，减少过拟合风险。

摘要由CSDN通过智能技术生成

一、在RGB图像上的卷积

3表示通道数目，图像中的通道数目必须等于过滤器中的通道数目

卷积核的维度是3*3*3，不是简单的矩阵的叠加，有时候，会把这个画成三位立方体

卷积计算过程：用立方体中的每个数字分别与图像的红绿蓝三通道的对应数字相乘

对应数字相加，就可以得到4*4矩阵中的第一个数字

如果想要检测图片里的红色通道的边缘：

检测任何颜色的边缘：

多个卷积核（过滤器）得到多个输出，不同的过滤器可能有不同的特征提取作用

总结：

一直在用通道（channel）数量作为最后一个维度，在某些文献中，称之为3D立方体的深度

二、单层卷积网络

与非卷积神经网络对比：

这里的a[0]就是6*6*3的图像输入，过滤器的作用和w[1]类似，偏置项b和b[1]的作用类似，再经过激活函数，得到输出a[1]

练习

一共有280个参数要学习，优点是不论输入图像时1000*1000还是5000*5000，都只有这280个参数

用这10个过滤器检测不同的特征，比如水平边缘线、竖直边缘线或其他不同的特征，不管图片多大，所使用的参数都是一样的的，这个特征使得卷积神经网络不太容易过拟合

用l表示第l个卷积层

f[l]表示第l层的过滤器的维度，p[l]表示第l层填充，s[l]表示步长，nc[l]表示过滤器的数目

Input：接收的是上一层卷积层输出的图像特征的维度

上图中还给出了怎么计算当前层的输出图像的长度和宽度，输出通道数就等于过滤器的数目

Each filter：通道数应该与输入图像的通道数一致

Activations：与输出图像的维度保持一致

A[l]:梯度下降

Weights：所有过滤器的权重的维度就是所有的过滤器的大小总和，过滤器的数目由当前层决定，每个过滤器的通道数由上一层输出图像的通道数决定

关注

9
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
吴恩达CNN之三维卷积

学习之后对卷积神经网络的工作原理有了更加深刻的理解，尤其对卷积核的个数，通道数这些名词都有了更急清楚的认识
复制链接

扫一扫

博客等级

码龄4年

40
原创

163
点赞

420
收藏

122
粉丝

关注

私信

热门文章

分类专栏

蓝桥杯嵌入式STM32G431RBT6 15篇

最新评论

吴恩达CNN之三维卷积
ha_lydms: 这篇博客真是我心灵的驿站，让我觉得自己有了一个可以倾诉的对象。
STM32G431RBT6---LED_LCD_Key模块综合
zhu18215444479: 为什么会有三个错误呢
STM32G431RBT6---模板整理笔记之RTC
m0_75247650: 博主大大，那个代码覆盖掉以前的代码步骤是哪样的，我初始化怎么没看到那几行代码

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。