深度学习基础知识

最新推荐文章于 2024-09-12 15:50:44 发布

yulianran

最新推荐文章于 2024-09-12 15:50:44 发布

阅读量994

点赞数 8

文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/u013107477/article/details/140928303

版权

一、卷积神经学(冒着被导师tao的风险写下来，导师内心os：竟然还从这么基础开始看！！！)

1、卷积的概念：

卷积来源于英文的Convolution，其中Con是积分，vol是转、卷。

卷积是一种数学运算，常用于信号处理和图像处理等领域，它用简单的数学形式，描述了一个动态的过程。

卷积的定义如下（这个复杂的公式，在卷积神经网络中可能是用不到）：

设 f 和 g 是两个定义在实数域上的函数，它们的卷积 f∗g 定义为：

其中 t 为实数，τ 是积分变量。

在离散形式下，如果 f 和 g 是两个长度为 n 的向量，它们的卷积 f∗g 定义为：（这个公式有待于进一步查找学习）

其中 k 是整数，[i] 表示向量 f 的第 i 个元素。

2、卷积神经网络（Convolutional Neural Networks）是一种深度学习模型或类似于人工神经网络的多层感知器，常用来分析视觉图像。该算法的灵感来自于人脑的一部分，即视觉皮层。视觉皮层是人脑的一部分，负责处理来自外界的视觉信息。它有不同的层，每一层都有自己的功能，即每一层从图像或任何视觉中提取一些信息，最后将从每一层接收到的所有信息组合起来，对图像/视觉进行解释或分类。同样，CNN有各种滤波器，每个滤波器从图像中提取一些信息，例如边缘、不同种类的形状（垂直、水平、圆形），然后将所有这些组合起来识别图像。在过去的几年中，CNN已经在图像识别、目标检测、图像生成和许多其他领域取得了显著的进展，成为了计算机视觉和深度学习研究的重要组成部分。

通道（之前带ps图像处理课程，和师弟讨论时候一直混淆，这下有石锤解释了）和一幅图像根本就没关系！数字图像是矩阵，矩阵只描述其空间位置和在色彩上的分量，哪有通道了？通道是什么？CHANNEL！图片中有channel这个概念吗？有个回答说通道类似颜料，这个意思就有点接近了。想要什么颜色，对应的通道里的灰度值就大一点就行了。

2.卷积核

卷积核是一种可学习的滤波器，用于对输入图像进行特征提取。卷积核通常是一个小的二维矩阵，其大小通常为 k×k，其中 k 是一个正整数，称为卷积核大小。卷积核的值通常是由神经网络自动学习得到的。

卷积核的作用是提取输入数据的局部特征。在卷积操作中，卷积核可以识别输入图像中的不同特征，例如边缘、纹理、角落等，从而提取更加高级的特征表示。通过使用多个卷积核，可以提取不同类型的特征，形成更加复杂的特征表示，进而提高模型的性能。

不同的卷积核（即采用不同的二维矩阵）可以实现不同的效果，常见的卷积核有：

        Sobel卷积核：边缘检测；
        Scharr卷积核：也是边缘检测卷积核，比Sobel更加平滑；
        Laplacian 卷积核：用于检测图像中的边缘和角点，具有旋转不变性和尺度不变性；
        高斯卷积核：用于图像平滑，减少图像中的噪声和细节信息；
        梯度卷积核：用于检测图像中的梯度信息，如水平和垂直方向的梯度；
        Prewitt 卷积核：用于检测图像中的边缘信息，与 Sobel 卷积核类似，但效果略差；
        Roberts 卷积核：用于检测图像中的边缘信息，与 Sobel 卷积核类似，但计算速度更快，精度稍低；
        LoG 卷积核：Laplacian of Gaussian 卷积核，是 Laplacian 卷积核和高斯卷积核的组合，用于检测图像中的边缘和斑点。

3. 卷积核大小
卷积核的大小是卷积神经网络中的一个超参数，通常与输入数据的尺寸以及需要提取的特征的大小有关。在卷积神经网络中，卷积核的大小通常比较小，例如常见的卷积核大小为 3 或 5，因为较小的卷积核可以更好地保留输入图像中的局部特征。

同时，卷积核的大小也需要根据卷积操作的步幅和填充等超参数进行选择。在后面例子中，卷积核大小为 3，步幅为 1，填充为 1，即每次卷积操作会对输入图像中的 3 × 3 3\times33×3 的区域进行处理，并生成一个相同大小的卷积特征。填充的目的是为了保留输入图像的边缘信息，以避免在卷积操作中丢失像素。

需要注意的是，卷积核大小的选择需要根据具体问题进行调整，通常需要通过实验来确定最佳的超参数。

2.卷积层工作原理

卷积层的作用：就是提取图片每个小部分里具有的特征
假定我们有一个尺寸为 6∗6 的图像，每一个像素点里都存储着图像的信息。我们再定义一个卷积核（相当于权重），用来从图像中提取一定的特征。卷积核与数字矩阵对应位相乘再相加，得到卷积层输出结果。

卷积层具体工作过程：
比如我们设计的一个卷积核如下左，想要识别出来的曲线如下图：

现在我们用上面的卷积核，来识别这个简化版的图片——一只漫画老鼠。当机器识别到老鼠的屁股的时候，真实区域数字矩阵与卷积核相乘作用后，输出较大：6600；而用同一个卷积核，来识别老鼠的耳朵的时候，输出则很小：0 。

我们就可以认为：现有的这个卷积核保存着曲线的特征，匹配识别出来了老鼠的屁股是曲线的。我们则还需要其他特征的卷积核，来匹配识别出来老鼠的其他部分。卷积层的作用其实就是通过不断的改变卷积核，来确定能初步表征图片特征的有用的卷积核是哪些，再得到与相应的卷积核相乘后的输出矩阵。（本想运行一个小程序再发布，不想遇到点问题，先发布一个吧）

后面要加强实践了哦，实践出真知

图片很多引用此处，把我小白讲的很清楚，十分感谢，如侵删（https://www.cnblogs.com/haohai9309/p/18211716