计算机视觉
计算机视觉问题
- 图片分类
目标检测
画风迁移
在大图片上的深度学习
如果采用传统的全连接层,可能会导致参数巨大,导致无法进行计算。卷积神经网络由此产生
边缘检测的例子
可以设计一些专用的filter来提取图片的纵向边缘和横向边缘
- vertical edges
- horizontal edges
这些专用的filters是计算机视觉专家精心设计出来的,往往可以提取一些不错的特征,但每次人为去设计,可能不够灵活。我们应该尝试让数据说话。也就说去学习一些filters
Padding组件
为什么要引入Padding组件
- 卷积操作会使输出缩小太快
- 卷积操作会导致输出中只有极少数值会受到图像边缘像素的影响,这样相当于丢失了一些边缘像素的信息
Strided 组件
strided卷积的例子
strided卷积的总结
在立体上的卷积
在RGB图像上的卷积
采用多个卷积filters
单层卷积神经网络
单层神经网络的例子
单层卷积神经网络的符号规定
Pooling组件
- Max Pooling(常用)
- Average Pooling(不常用)
Pooling层总结
- 池化前后通道的数量不变
池化层没有需要学习的参数
卷积神经网络层的类型
卷积层
- 池化层
- 全连接层
一个完整的卷积神经网络的例子
- 参数主要集中在全连接层
- 随着层数的递增, nH和nW 都是递减的, nC 是递增的
为什么卷积是有意义的
- 参数共享:如果一个特征探测器在图像的某个部分是有用的,那么他很有可能在图像的另外的部分也是有用的
- 稀疏连接:在每一层,每一个输出中的只依赖一小部分的输入