【深度学习基础】人工智能、机器学习、深度学习以及卷积神经网络概念和联系

📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨
📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852
📢:文章若有幸对你有帮助,可点赞 👍 收藏 ⭐不迷路🙉
📢:内容若有错误,敬请留言 📝指正!原创文,转载请注明出处


组成

一个简单的卷积神经网络是由各种层按照顺序排列组成的,网络中每个层使用一个可微分的函数将数据从一层传递到下一层,通常卷积神经网络主要由种类型的层组成:卷积层、批正则化层、非线性映射层、池化层、全连接层等。通过将这些层叠加起来,就可以构建出一个完整的卷积神经网络,最后在根据任务的不同定义不同的函数。
在这里插入图片描述

卷积运算

卷积运算是卷积神经网络中最基本的组成部分,计算过程就是元素乘积求和。卷积运算可采用合适的卷积核(过滤器、滤波器,英文为fliter)实现垂直边缘的检测。本身卷积核就好像一个孔径大小一致的过滤器一样,筛选出不能通过去的物质。因此卷积核本身就有特征,可以是垂直检测,也可以是水平边缘检测,通过修改卷积核中的参数,可以做到任意角度的边缘检测。
卷积运算有两个缺点:
1.随着卷积的次数不断增加,图像的尺寸会越来越小;
2.图像中处于角落的像素在运算时候由于参与运算的次数只有一次,因此该像素将会丢失。

为了解决上述的两个问题,在原来像素的基础在外围添加像素层数,不仅可以增加图像的尺寸还可以增加边缘像素参与运算的次数。其中填充的层数称为padding。NXn尺寸的图像乘以f*f卷积核的运算,得到(n-f+1)X(n-f+1)的新图像。Padding的中文意思就是填充。

6.过滤器一般都是设计成奇数的,有两点原因:1.这样的话padding取值是对称的;2.过滤器有一个中心参数。
7.步长S的定义就是说过滤器在移动过程中是每两步移动一下,包括水平移动和垂直移动。也就是说每连续移动两步就会输出一个数据,这样的例子中步长就是2。
8.N:定义为图像的尺寸边长;f:定义为过滤器的尺寸边长;p:定义为增加的层数;s:步长,最后得到的图像尺寸的计算公式为:()*()
7.图像在计算机中就是由很多很多像素组成的,每个像素对应一个数,因此图像可以当做一个矩阵,在处理过程中其实就是对它的像素进行处理,比如进行矩阵运算。
8.卷积运算不仅可以应用在平面(二维)图像上,也就是黑白图,只有两种颜色,也可以运用在三维的图像上,所谓的三维图像其实就是RGB、彩色图像,它是由三通道的颜色组成的,因此我们可以将一张彩色图看成由三张图叠加而成的,分别是红绿蓝三张图。
9.在卷积运算中,彩色图是要跟一个三维的过滤器进行乘积的,这个三维过滤器其实就是为了对应彩色图中红绿蓝三个通道的。
11.输出图像的通道数等于过滤器的数量。
12.在进行卷积运算之后得到的最后图像进行输出,将高乘以宽再乘以通道数记得到所有特征,将这些特征排列成一列输出,也就是列向量,然后在输入到softmax填充函数中。
13.在进行多次卷积运算中,图像的尺寸会逐渐减小,通道数会逐渐增加。一个经典的卷积神经网络通常有三层,一个是卷积层,一个是池化层,最后是全连接层。
14.池化层其中含有最大池化层,它与卷积层的区别在于卷积运算的不同,输出图像的尺寸计算公式是一样的,池化层选取过滤器内含有特征的值,比如最大值,平均值,分别代表着池化层中的最大池化层和平均池化层。
15.卷积运算过程中的参数不仅包含了过滤器中的参数,还包含了一个输出的矩阵存在的偏差,这个偏差也是一个参数。
9.典型神经网络有LeNet-5、AlexNet、VGG-16。
学习视频链接:人工智能进化史
看完视频以下内容可以忽略。(本人才疏学浅,哈哈!)

什么是物体检测?机器学习?深度学习?卷积神经网络?

基于学习后,发表一下个人浅显的见解。

物体检测

1.物体检测其实就是对图像中的物体进行识别分类和定位。也就是包括物体识别和物体定位两个作用。
2.物体检测分为传统的和基于深度学习的,前者的缺点是对复杂场景中的物体进行检测时实时性差,也就是计算能力跟不上。后者基于深度学习的实体检测,被称为卷积神经网络CNN,基于此,逐渐完善发展为R-CNN,Fast R-CNN,Faster R-CNN,Mask R-CNN
3.图像识别指的是识别一个物体,准确来说就是识别出包含单个目标的图片所属的类别。而目标检测,或是叫物体检测,指的是能在包含了多个物体的图像中识别出物体来。准确来说是输出每个对象的边界框和类别。物体检测目前在无人驾驶方面应用是很显著的.

1.人类学习

首先从人的学习讲起,我们人类学习一个陌生的知识,会去通过多种方式获取相关的信息,有来自搜索的词条、教学视频、资料等等,之后我们会看到并总结这个知识的含义、特点、应用等等扩展的知识,并且在大脑中保存一定的时间,之后当要用的时候我们会从大脑中提取甚至利用这些知识。

2.机器学习

对于机器的学习而言,比如摄像头拍摄一张图片,机器能告诉人们这张图片里面想要的信息,这就是机器学习。但是机器人没有大脑,它不会自己学习和总结知识,因此要完成这个过程,首先我们需要为机器人建立一个库(或者叫做模型),这个库里面包含了大量的信息,包括文字、图片、语音等等,机器人通过比对输入的和库里的信息,进行输出。由于文字、图片当中所蕴含的知识非常丰富,需要进行特征提取,输出给人们想要的信息,这就是传统的机器学习。

3.深度学习

而深度学习就是不用人为为机器人建立这个库,机器人自己就能通过神经网络总结所输入信息的规律和逻辑,自行建库。因此深度学习是机器学习的一个新领域,而且是目前最火热的研究,阿尔法狗就是利用了深度学习,比使用传统机器学习的深蓝强。

4.卷积神经网络

是深度学习中主要针对图像处理的一个方向。

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

嵌小超

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值