CNN卷积神经网络基础知识

樱木之

已于 2023-03-02 13:00:15 修改

阅读量1.6k

点赞数 1

分类专栏：人工智能文章标签： cnn 人工智能神经网络

于 2022-10-01 17:17:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43369406/article/details/127134277

版权

人工智能专栏收录该内容

72 篇文章 10 订阅

订阅专栏

卷积神经网络基础知识

本文主要介绍CNN，convolutional neural network的基础知识，目录如下：

卷积神经网络历史
CNN组成和介绍
全连接层；卷积层；池化层；
FP和BP算法
激活函数；FP算法；BP算法；优化器；

本文参考的资料如下：

1.1 卷积神经网络基础https://www.bilibili.com/video/BV1b7411T7DA
LaTeX数学符号大全https://blog.csdn.net/LCCFlccf/article/details/89643585
卷积动画详解https://blog.csdn.net/haohulala/article/details/107332661
1.2 卷积神经网络基础补充https://www.bilibili.com/video/BV1M7411M7D2

卷积神经网络历史

1998年，yanglecun（美国人）提出来的CNN模型如下：

请添加图片描述

简略历史如下：

请添加图片描述

CNN组成和介绍

CNN的主要组成包括dense layer全连接层，convolutional layer卷积层，subsampling layer/down-pooling下采样层和upsampling layer上采样层，其中downsampling layer用于特征提取/减少，upsampling layer用于增加特征。

全连接层

在全连接层中，即将每个节点全连接并赋予权重值（可能还会增加bias偏置值）。全连接网络例子如下：

请添加图片描述

全连接层参数个数计算：

全连接层的参数个数计算取决于该层的输入维度、输出维度以及权重矩阵的大小。具体计算公式如下：

假设输入维度为 $n$ ，输出维度为 $m$ ，权重矩阵的大小为 $w\times h$ ，则全连接层的参数个数为：

请添加图片描述

其中， $n + 1$ 是因为每个神经元都有一个偏置项。

举个例子，假设输入维度为 1000，输出维度为 500，权重矩阵的大小为 200x100，则全连接层的参数个数为：

在这里插入图片描述

因此，这个全连接层的参数个数为 100,100,000。

卷积层

卷积层中最重要的就是filter/convolutional kernel卷积核，卷积层的主要目的是对图像进行特征提取，而每一次卷积即将卷积核和图像上数字进行矩阵点乘。

在这里插入图片描述

矩阵相乘分为矩阵叉乘（又叫矩阵乘， ${A}\times{B}$ ），矩阵点乘（ ${A}\cdot{B}$ ）。矩阵乘法即线性代数中的一行乘一列，矩阵点乘即两矩阵对应元素相乘。

卷积层具有局部感知机制和权值共享。其中权值共享机制使得每一层卷积所需要的参数大大小于全连接层所需要的参数。例子如下：

在这里插入图片描述

需要注意的是：1. 卷积核的channel(深度/维数)与输入特征矩阵的channel相同；2. 输出特征矩阵的channel(深度/维数)与卷积核的个数相同。

对于输出特征矩阵，它的深度和卷积核个数相同，而对于它的大小则和输入图片大小，卷积核大小，步长，补充像素有关。输出特征矩阵大小的计算公式如下：

在这里插入图片描述

卷积层参数个数计算：

卷积层的参数个数计算取决于该层的卷积核尺寸、输入通道数、输出通道数。具体计算公式如下：

假设卷积核尺寸为 $k\times k$ ，输入通道数为 $c_{in}$ ，输出通道数为 $c_{out}$ ，则卷积层的参数个数为：

在这里插入图片描述

其中， $c_{in}\times k\times k$ 是卷积核中的权重参数个数， $1$ 是偏置参数个数。

举个例子，假设卷积核尺寸为 $3\times 3$ ，输入通道数为 64，输出通道数为 128，则卷积层的参数个数为：

在这里插入图片描述

因此，这个卷积层的参数个数为 73,856。

需要注意的是，在计算参数个数时，如果卷积层的padding、stride、dilation等超参数发生变化，计算公式也需要做相应的修改。

下采样层/池化层

下采样层的主要目的是对特征图进行稀疏处理，减少数据运算量。它具有以下三个特点：

没有训练参数。即不会和卷积层一样，需要更新/修正卷积核的参数。
只改变特征矩阵的w和h，不改变channel。
一般poolsize和stride相同。

下图以Maxpooling层为例：

请添加图片描述

FP和BP算法

我们使用FP算法更新预测值 $\hat{output}$ ，使用BP算法更新权重值weight。

在这里插入图片描述

激活函数

引入激活函数即引入非线性因素使我们的网络具备解决非线性问题的能力。常见的有sigmoid/logic，softmax，ReLU等。

在这里插入图片描述

FP算法

FP，forward propagation。用于更新预测值 $\hat{o_1}$ 。我们用上一层结果乘以权重再放入激活函数中得到下一层的输入结果，FP算法例子如下：

在这里插入图片描述

最终我们经历一系列计算得到了最终的output，我们根据经验选择适合的loss function损失函数，最终计算出来我们的Loss值（即自变量是weight权重值，因变量是Loss损失值）。

在这里插入图片描述

BP算法

我们得到了自变量为wight，因变量为Loss的函数。而我们在学习中要完成的终极目标就是使得损失函数的输出值尽量小，而多元函数的值要变小，便是让损失函数沿着下降最快的方向（梯度方向）下降，所以我们用链式法则求偏导，使用BP算法更新权重值如下：

在这里插入图片描述

手写推导部分如下：

在这里插入图片描述

梯度下降算法

在这里插入图片描述

优化器

如采用分批次等方法，使得更快收敛

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
CNN卷积神经网络基础知识

CNN基础知识
复制链接

扫一扫

专栏目录

博客等级

码龄6年

348
原创

342
点赞

1085
收藏

234
粉丝

关注

私信

热门文章

分类专栏

yuque 91篇
macos 1篇
语义分割 5篇
人工智能 72篇
microDL 1篇
工作日志 1篇
models 6篇
数学 1篇
计算机图形学 3篇
网络安全 2篇
个人网站 6篇

最新评论

toefl reading_托福阅读
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
生物样品培养
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
AWS无账号使用
今天也是个妖精头子呀: [code=plain] aws s3 ls s3://sra-pub-src-13/SRR12660772/ --no-sign-request [/code] An error occurred (AccessDenied) when calling the ListObjectsV2 operation: Access Denied 显示无权限访问。
DataModule, Module和Trainer测试代码
ha_lydms: 作者的文字总是能够打动我的心灵，让我感到内心温暖和安慰。
with torch.no_grad()解答
谢小浩: 偶，梯度裁剪是什么不重要

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。