【深度学习基础】人工智能、机器学习、深度学习以及卷积神经网络概念和联系

嵌小超

已于 2023-08-12 17:09:51 修改

阅读量772

点赞数 4

分类专栏： # Deep Learning 文章标签：深度学习机器学习

于 2021-04-06 23:27:15 首次发布

本文链接：https://blog.csdn.net/weixin_51244852/article/details/115474162

版权

Deep Learning 专栏收录该内容

14 篇文章 3 订阅

订阅专栏

📢：如果你也对机器人、人工智能感兴趣，看来我们志同道合✨
📢：不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】
📢：文章若有幸对你有帮助，可点赞 👍 收藏 ⭐不迷路🙉
📢：内容若有错误，敬请留言 📝指正！原创文，转载请注明出处

组成

一个简单的卷积神经网络是由各种层按照顺序排列组成的，网络中每个层使用一个可微分的函数将数据从一层传递到下一层，通常卷积神经网络主要由五种类型的层组成：卷积层、批正则化层、非线性映射层、池化层、全连接层等。通过将这些层叠加起来，就可以构建出一个完整的卷积神经网络，最后在根据任务的不同定义不同的函数。
在这里插入图片描述

卷积运算

卷积运算是卷积神经网络中最基本的组成部分，计算过程就是元素乘积求和。卷积运算可采用合适的卷积核（过滤器、滤波器，英文为fliter）实现垂直边缘的检测。本身卷积核就好像一个孔径大小一致的过滤器一样，筛选出不能通过去的物质。因此卷积核本身就有特征，可以是垂直检测，也可以是水平边缘检测，通过修改卷积核中的参数，可以做到任意角度的边缘检测。
卷积运算有两个缺点：
1.随着卷积的次数不断增加，图像的尺寸会越来越小；
2.图像中处于角落的像素在运算时候由于参与运算的次数只有一次，因此该像素将会丢失。
为了解决上述的两个问题，在原来像素的基础在外围添加像素层数，不仅可以增加图像的尺寸还可以增加边缘像素参与运算的次数。其中填充的层数称为padding。NXn尺寸的图像乘以f*f卷积核的运算，得到（n-f+1）X（n-f+1）的新图像。Padding的中文意思就是填充。

6.过滤器一般都是设计成奇数的，有两点原因：1.这样的话padding取值是对称的；2.过滤器有一个中心参数。
7.步长S的定义就是说过滤器在移动过程中是每两步移动一下，包括水平移动和垂直移动。也就是说每连续移动两步就会输出一个数据，这样的例子中步长就是2。
8.N:定义为图像的尺寸边长；f:定义为过滤器的尺寸边长；p:定义为增加的层数；s:步长，最后得到的图像尺寸的计算公式为：（）*（）
7.图像在计算机中就是由很多很多像素组成的，每个像素对应一个数，因此图像可以当做一个矩阵，在处理过程中其实就是对它的像素进行处理，比如进行矩阵运算。
8.卷积运算不仅可以应用在平面(二维)图像上，也就是黑白图，只有两种颜色，也可以运用在三维的图像上，所谓的三维图像其实就是RGB、彩色图像，它是由三通道的颜色组成的，因此我们可以将一张彩色图看成由三张图叠加而成的，分别是红绿蓝三张图。
9.在卷积运算中，彩色图是要跟一个三维的过滤器进行乘积的，这个三维过滤器其实就是为了对应彩色图中红绿蓝三个通道的。
11.输出图像的通道数等于过滤器的数量。
12.在进行卷积运算之后得到的最后图像进行输出，将高乘以宽再乘以通道数记得到所有特征，将这些特征排列成一列输出，也就是列向量，然后在输入到softmax填充函数中。
13.在进行多次卷积运算中，图像的尺寸会逐渐减小，通道数会逐渐增加。一个经典的卷积神经网络通常有三层，一个是卷积层，一个是池化层，最后是全连接层。
14.池化层其中含有最大池化层，它与卷积层的区别在于卷积运算的不同，输出图像的尺寸计算公式是一样的，池化层选取过滤器内含有特征的值，比如最大值，平均值，分别代表着池化层中的最大池化层和平均池化层。
15.卷积运算过程中的参数不仅包含了过滤器中的参数，还包含了一个输出的矩阵存在的偏差，这个偏差也是一个参数。
9.典型神经网络有LeNet-5、AlexNet、VGG-16。
学习视频链接：人工智能进化史、
看完视频以下内容可以忽略。（本人才疏学浅，哈哈！）

什么是物体检测？机器学习？深度学习？卷积神经网络？

基于学习后，发表一下个人浅显的见解。

物体检测

1.物体检测其实就是对图像中的物体进行识别分类和定位。也就是包括物体识别和物体定位两个作用。
2.物体检测分为传统的和基于深度学习的，前者的缺点是对复杂场景中的物体进行检测时实时性差，也就是计算能力跟不上。后者基于深度学习的实体检测，被称为卷积神经网络CNN，基于此，逐渐完善发展为R-CNN，Fast R-CNN，Faster R-CNN，Mask R-CNN
3.图像识别指的是识别一个物体，准确来说就是识别出包含单个目标的图片所属的类别。而目标检测，或是叫物体检测，指的是能在包含了多个物体的图像中识别出物体来。准确来说是输出每个对象的边界框和类别。物体检测目前在无人驾驶方面应用是很显著的.

1.人类学习

首先从人的学习讲起，我们人类学习一个陌生的知识，会去通过多种方式获取相关的信息，有来自搜索的词条、教学视频、资料等等，之后我们会看到并总结这个知识的含义、特点、应用等等扩展的知识，并且在大脑中保存一定的时间，之后当要用的时候我们会从大脑中提取甚至利用这些知识。

2.机器学习

对于机器的学习而言，比如摄像头拍摄一张图片，机器能告诉人们这张图片里面想要的信息，这就是机器学习。但是机器人没有大脑，它不会自己学习和总结知识，因此要完成这个过程，首先我们需要为机器人建立一个库（或者叫做模型），这个库里面包含了大量的信息，包括文字、图片、语音等等，机器人通过比对输入的和库里的信息，进行输出。由于文字、图片当中所蕴含的知识非常丰富，需要进行特征提取，输出给人们想要的信息，这就是传统的机器学习。

3.深度学习

而深度学习就是不用人为为机器人建立这个库，机器人自己就能通过神经网络总结所输入信息的规律和逻辑，自行建库。因此深度学习是机器学习的一个新领域，而且是目前最火热的研究，阿尔法狗就是利用了深度学习，比使用传统机器学习的深蓝强。

4.卷积神经网络

是深度学习中主要针对图像处理的一个方向。

嵌小超

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
【深度学习基础】人工智能、机器学习、深度学习以及卷积神经网络概念和联系

什么是机器学习？深度学习？卷积神经网络？首先从人的学习讲起，我们人类学习一个陌生的知识，会去通过多种方式获取相关的信息，有来自搜索的词条、教学视频、资料等等，之后我们会看到并总结这个知识的含义、特点、应用等等扩展的知识，并且在大脑中保存一定的时间，之后当要用的时候我们会从大脑中提取甚至利用这些知识。对于机器的学习而言，比如摄像头拍摄一张图片，机器能告诉人们这张图片里面想要的信息，这就是机器学习。但是机器人没有大脑，它不会自己学习和总结知识，因此要完成这个过程，首先我们需要为机器人建立一个库（或者叫做模型）
复制链接

扫一扫