深度学习可以说救了计算机视觉
卷积神经网络可以做的事情
- 检测任务
- 在摄像头中检测或者追踪
- 图像遍历分割
- 分类和检索
- 超分辨率重构
- 医学任务
- 无人驾驶
- 人脸识别
只要有特征了,还有什么东西不能做!~
GPU 图像处理单元
- 处理图像任务
- 做卷积
- 做全连接
- 做各种运算
比CPU快100倍!!
在学习阶段我们还是可以用CPU来跑代码,在实际的项目中我们推荐使用GPU来跑
但凡能跟图像搭上边的,都可用神经网络或者卷积神经网络来做
用CNN卷积神经网络来做点东西
神经网络是用来干什么的?
神经网络是用来做特征提取的
卷积神经网络CNN也是用来做特征提取的
- 解决当前存在的问题,视频说白了就是图像的数据
如何进行特征提取?
需要的训练比较高
提出一种做卷积的特征提取方法
卷积网络和传统网络的区别
-
NN传统神经网络
- 看起来像二维
- 输入的东西是784像素点,是一维的列向量
-
CNN卷积神经网络
- 像三维
- 输入28281的长方体矩阵,三维的
- hwc
c表示的是3维的
整体架构
- 输入层
- 28281
卷积层
提取特征池化层
压缩特征- 全连接层
通过权重
卷积做的事
把一张图像分成好多部分
- 先把图像进行分割成一块块的小区域
- 每个小区域的图像特征是不一样的
- 选择一种计算方法,计算每一个区域他应该的特征值是多少
在1号区域进行特征提取特征值
使用权重参数得到特 征值
- x1是我们拿到的当前区域
- w1是权重参数矩阵
找到最好的权重参数矩阵
使得最后的特征提取效果最好
把绿色的东西叫做特征图
图像颜色通道
32323
图像是有通道的
- 让每个通道的颜色单独去做计算
- 把每个通道的结果卷积在一起
过程
- 每个区域单独计算单独通道的值。其实是3个通道
- 3个通道的值分别加在一起。
- 找一个三维的立体区域
- 找特征值
- 分区域对当前的数据进行特征提取
维度必须是一样的
输入的东西是7*7*3的
意思是表格的长是7
宽度是7
总共3维,3个
输入的东西中c是多少,filter中的个数 也必须和他一起对应
filter中的数据3*3*3
前面的两个3*3表示的是在原始图像中每多大的小区域选取一个特征
对应的是一个特征值
从图片中我们可以观察到从原始图像中计算的3个不同通道的值是不一样的。
卷积核的值按权重计算