一.上采样
概念:
上采样:又名放大图像,图像插值
主要目的是放大原图像,从而可以显示在更高分辨率的显示设备上
上采样有3种常见的方法:双线性插值、反巻积、反池化
原理:
图像放大几乎都是采用内插值方法,即在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素。插值算法包括了传统插值,基于边缘图像的插值,还有基于区域的图像插值
二.下采样
概念:
下采样:又名降采样、缩小图像
主要目的有两个:1.使得图像符合显示区域的大小 2.生成对应图像的缩略图
其实下采样就是池化
原理:
对于一幅图像尺寸为M*N,对其进行S倍下采样,即得到(M/S)*(N/S)尺寸的分辨率图像,当然S应该是M和N的公约数才可以;如果考虑是矩阵形式的图像,就是把原始图像s*s窗口内的图像变成一个像素,这个像素点的值就是窗口内所有像素的均值或者最大值(也就是池化操作等)
对图像的缩放操作并不能带来更多关于该图像的信息,因此图像的质量将不可避免的受到影响。然而,确实有一些缩放方法能够增加图像信息,从而使得缩放后的图像质量超过原图质量
其实下采样就是池化
采样层是使用pooling的相关技术来实现的,目的就是用来降低特征的维度并保留有效信息,一定程度上避免过拟合;但是pooling的目的不仅仅是这些,他的目的是保持旋转、平移、伸缩不变形等。采样有最大值采样、平均值采样、求和区域采样和随即区域采样等;
池化也是这样的,比如最大值池化,平均值赤池化,随即池化,求和区域池化等
三.巻积
一次巻积运算指的是:如下图,当我们有一个过滤器(黄色矩阵块,又称巻积核,也是矩阵);
移动巻积核,将这个方块对应要处理的输入矩阵的一部分,位置一一对应相乘,然后把结果再相加得到一个数
上面这幅图是对一个5*5的矩阵进行3*3的矩阵的巻积
那么就从左上角到右下角,生成巻积之后的矩阵大小是(5-3+1)*(5-3+1)的矩阵,生成之后的矩阵的元素值,是之前的两个矩阵对应元素的乘积之和
四.池化
池化最直观的作用就是降维,常见的池化有最大池化、平均池化、随即池化;池化层不需要训练参数
最大池化可以获取局部信息,可以更好保留纹理上的特征;如果不用观察物体在图片中的具体位置,只关心其是否出现,则使用最大池化效果比较好
平均池化往往能保留整体数据的特征,能凸现出背景信息
随即池化中元素值大的被选中的概率也大,但不是向最大池化总是取最大值。随即池化一方面最大化的保证了Max值的取值,一方面又确保了不会完全是Max值起作用,造成过度失真;除此之外,其可以在一定程度避免过拟合
如下图,左侧是4*4矩阵,要进行大小为2*2的池化