卷积神经网络的直观解释（笔记）

最新推荐文章于 2024-07-25 18:25:30 发布

忧郁一休

最新推荐文章于 2024-07-25 18:25:30 发布

阅读量1w

点赞数 6

分类专栏：卷积神经网络文章标签：神经网络卷积神经网络池化 ReLU 全连接

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/youyuyixiu/article/details/60465126

版权

本文介绍了卷积神经网络的基础概念，包括卷积、ReLU、池化和全连接层，以及其在图像识别领域的应用。通过LeNet的案例，解释了卷积层如何提取特征，ReLU引入非线性，池化降低维度，全连接层进行分类。文中还概述了卷积网络的发展历程，从LeNet到AlexNet、GoogLeNet、VGGNet和ResNets等里程碑式的模型。

摘要由CSDN通过智能技术生成

原文地址：请戳这里
译文地址：请戳这里

这篇博文让我对卷积神经网络有了更好的理解，我把要点整理在这里，供以后回顾：
如果你对神经网络也不是很熟悉的话，请戳这里

卷积神经网络（ ConvNets或者CNNs）是神经网络的范畴。

应用领域：图像识别、语音识别、自然语言处理（如语句分类）。可以识别人脸、物体和交通信号，从而为机器人和自动驾驶汽车提供视力。也可以识别场景，提供相关的标签。

LeNets架构（1990s）

LeNets是最早的卷积神经网络。
经过多次成功迭代，1998年，Yann LeCun 把这项工作命名为LeNets5。该架构主要用于字符识别，如邮编，数字等。

卷积神经网络如下图所示：

这里写图片描述

主要有四个操作：

卷积
非线性处理（ReLU）
池化或亚采样
分类（全连接层）

图像是像素值的矩阵

这里写图片描述

通道：用于表示图像的某种组成。一个标准数字相机拍摄的图像会有三通道 - 红、绿和蓝；你可以把它们看作是堆在一起的深度为3的二维矩阵（每一个通道代表一个颜色），每个通道的像素值在 0 到 255 的范围内。

灰度图像：仅仅只有一个通道，就是一个普通的二维矩阵。矩阵中各个像素的值在 0 到 255 的范围内——零表示黑色，255 表示白色。

卷积

卷积的目的：为了从输入图像中提取特征。卷积可以通过从输入的一小块数据中学到图像的特征，并可以保留像素间的空间关系。

原始图像：

最低0.47元/天解锁文章

关注

6
点赞
踩
22

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。