(没学太明白啊(ó﹏ò。)后面再看一些别的资料补充再来修改本文吧(超小声))
常用语影像处理
流程:
input → \to →convolution → \to →max pooling → \to →convolution → \to →max pooling … \dots … → \to →flatterm → \to →全连接前馈神经网络 → \to →output
用多次convolution和max pooling来提取图像特征,减少计算次数。
图案特征
- 图案比整张图小很多
- 同一图案出现在不同的区域
- 对像素下采样不会改变物品的基本信息
其中1、2用卷积,3用Max Pooling
Convolution
矩阵内积,移位,内积,移位…
- 黑白图像只有一个矩阵,彩色图需要RGB三个维度的矩阵
应用:像素点排成一列作为input,Filter作为权重,每次计算选择内积对应的点为输入,移位前后共用一套权重
⇒
\Rightarrow
⇒提取图像特征
Max Pooling
在卷积的结果中每n个一组,每组中取max,再按相对位置组成新的矩阵。
⇒
\Rightarrow
⇒缩小矩阵