在python环境下,这个函数雷点很多,特别是对于用python习惯的程序员来说更是容易犯错。因为opencv的主目标语言是C++,很多设计思想不够pythonic,如果你用python的习惯去理解它就容易犯错。这里只讨论python环境,C++的形参是指明类型的,比较好理解。
注意点:
- 输入的图片不仅可以是多维的,而且可以是多张图片组成的序列。当画多维直方图时,不是同时处理多张图片的意思,而是一个and操作 :
import numpy
import cv2 as cv
img = numpy.random.randint(0, 100, [100, 100, 3], dtype=numpy.uint8)
channels = [0, 2] # 统计B,R通道
ranges = [0, 100, 0, 100] # 两个通道的range都是0-100, 此参数必须是个 flattened vector(一维数组)
hist = cv.calcHist([img, ], channels, mask=None, histSize=[10, 10], ranges=ranges)
h = hist[0, 0] # 同时满足(B通道0-10) and (R通道0-10)的元素个数
print(h)
- images, channels,histSize 这几个参数必须是一组数据,calcHist()函数是批量处理图片的,所以输入是成批的。即使只有一张图也要按照批数据组织数据, python中单个数据应该是长度为1的序列,如images=[image, ], channels=[0, ]。
- images 输入图像阵列,注意是图像阵列(多幅图像),所有的图像必须有同样的深度(像素的数据类型相同),相同的size,但是每个图像可以有不同的channels。此参数在python中是一个序列(list,tuple等)或者4维矩阵(N*H*W*C)。
- channels 这个参数第二个参数是从第一幅图的channels-1开始计数的,比如处理两张3通道图片那么第二个元素应该是从3开始计数,这么设计的原因是把第一个形参(images)看成一个多张图片叠在一起的4维矩阵(N*H*W*C)。
- ranges 这个参数一定是一个1维数组(flattened vector),比如统计2通道直方图(
len(channels)=2
),那么这个参数应该是[min, max, min, max]。看起来别扭,但这么设计的原因可能是为了在C++里容易组织数据。