在 opencv 3.3 之后的版本中,支持调用训练好的深度学习框架,其中有一些重要的函数,今天先总结一下 blobFromImage 函数的用法
在进行深度学习或者图片分类时,blobFromImage 主要是用来对图片进行预处理。包含两个主要过程:
- 整体像素值减去平均值 (mean)
- 通过缩放系数(scalefactor)对图片像素值进行缩放
下面看一下这个函数的原型:
blobFromImage(InputArray image,
double scalefactor=1.0,
const Size& size = Size(),
const Scalar& mean = Scalar(),
bool swapRB = false,
bool crop = false,
int ddepth = CV_32F)
- image:这个就是我们将要输入神经网络进行处理或者分类的图片
- mean:需要将图片整体减去的平均值,如果我们需要对 RGB 图片的三个通道分别减去不同的值,那么可以使用 3 组平均值,如果只使用一组,那么就默认对三个通道减去一样的值。减去平均值(mean):为了消除同一场景下不同光照的图片,对我们最终的分类或者神经网络的影响,我们常常对图片的R、G、B通道的像素求一个平均值,然后将每个像素值减去我们的平均值,这样就可以得到像素之间的相对值,就可以排除光照的影响
- scalefactor:当我们将图片减去平均值之后,还可以对剩下的像素值进行一定的尺度缩放,它的默认值是1,如果希望减去平均像素之后的值,全部缩小一半,那么可以将 scalefactor 设为 1/2
- size:这个参数是我们神经网络在训练的时候要求输入的图片尺寸
- swapRB:opencv中认为我们的图片通道顺序是 BGR,但是我平均值假设的顺序是 RGB,所以如果需要交换 R 和 G,那么就要使 swapRB = true