OpenCV_用积分图像统计像素

最新推荐文章于 2024-05-21 14:44:09 发布

- birdguan -

最新推荐文章于 2024-05-21 14:44:09 发布

阅读量1.8k

点赞数

分类专栏： OpenCV

本文链接：https://blog.csdn.net/qq_30241709/article/details/78724121

版权

OpenCV 专栏收录该内容

10 篇文章 3 订阅

订阅专栏

在累加多个图像区域的像素时，积分图像显得非常有用。

取图像左上侧的全部像素计算累加和，并用这个累加和替换图像中的每一个像素，用这种方式得到的图像称为积分图像。计算积分图像时只需要对图像扫描一次，这是因为当前积分值等于上一像素的积分值加上当前行的累计值。因此积分图像就是一个包含像素累加和的新图像。

*自适应的阈值化

通过对图像应用阈值来创建二值图像是从图像中提取有意义元素的好方法。

现在我随手拍张书本照片，如下：

当应用单一阈值时，结果是这样的：

代码：

int main()
{
	cv::Mat image = cv::imread("book1.jpg");
	cv::cvtColor(image, image, CV_BGR2GRAY);
	cv::imshow("原图",image);
	cv::Mat binaryFixed;
	cv::threshold(image, binaryFixed, 150, 255, cv::THRESH_BINARY);
	cv::imshow("单一阈值结果", binaryFixed);
	cvWaitKey();
}

不管选用什么阈值，图像都会丢失一部分文本，还有部分文本会消失在阴影下，要解决这个问题，有一个办法就是采用局部阈值，即根据每个像素的邻域计算阈值，这种策略称为自适应阈值化，包括将每个像素的值与邻域的平均值进行比较。如果某像素的值与它的局部平均值差别很大，就会被当作异常值在阈值化过程中剔除。
自适应阈值化需要计算每个像素周围的局部平均值，可通过积分图像提高计算效率。

可以看出，自适应阈值比单一阈值的效果要好得多：

代码：

int main()
{
	cv::Mat image = cv::imread("book1.jpg");
	cv::cvtColor(image, image, CV_BGR2GRAY);
	cv::imshow("原图", image);
	cv::Mat iimage;
	cv::Mat result;
	cv::integral(image, iimage, CV_32S);
	int blockSize = 21;//邻域尺寸
	int threshold = 8;
	int halfSize = blockSize / 2;
	for (int j = halfSize; j < iimage.rows - halfSize - 1; j++)
	{
		uchar* data = image.ptr<uchar>(j);
		int* idata1 = iimage.ptr<int>(j - halfSize);
		int* idata2 = iimage.ptr<int>(j + halfSize + 1);
		for (int i = halfSize; i < iimage.cols - halfSize - 1; i++)
		{
			int sum = (idata2[i + halfSize + 1] - idata2[i - halfSize] - idata1[i + halfSize + 1] + idata1[i - halfSize]) / (blockSize*blockSize);
			if (data[i] < (sum - threshold))
				data[i] = 0;
			else
				data[i] = 255;
		}
	}
	cv::imshow("自适应阈值结果", image);
	cvWaitKey();
}

在OpenCV中也给出了自适应阈值化的函数 cv::adaptiveThreshold()

除了在阈值化中使用局部平均值，还可以使用高斯(Gaussian)加权累计值(ADAPTIVE_THRESH_GAUSSIAN_C标志)，这种实现方式比调用cv::adaptiveThreshold快一点

*直方图实现视觉追踪

有一种特殊情况，即由0和1组成的二值图像生成积分图像，这时的积分累计值就是指定区域内值为1 的像素总和。

此处已经研究了一天，代码仍是有误，先mark，回头看（问题出现在IngegralImage模板类的中符号重载函数的at函数）

IntegralImage模板类：

template<typename T, int N>class IntegralImage
{
	cv::Mat integralImage;
public:
	IntegralImage(cv::Mat image)
	{
		cv::integral(image, integralImage, CV_32S);
	}
	cv::Vec<T, N> operator() (int xo, int yo, int width, int height)
	{
		return (integralImage.at<cv::Vec<T, N>>(yo + height, xo + width)
			- integralImage.at<cv::Vec<T, N>>(yo + height, xo)
			- integralImage.at<cv::Vec<T, N>>(yo, xo + width)
			+ integralImage.at<cv::Vec<T, N>>(yo, xo));
	}
};

main函数：

int main()
{
	cv::Mat image = cv::imread("bike.jpg");
	cv::Mat imageROI = image(cv::Rect(350, 76, 100, 100));
	cv::rectangle(image, cv::Rect(350, 76, 100, 100),0);
	cv::imshow("手动识别图", image);
	Histogram1D h;
	h.setNBins(16);
	cv::Mat refHistogram = h.getHistogram(imageROI);
	cv::Mat newImage = cv::imread("bike2.jpg");
	cv::imshow("待检测图像", newImage);
	//首先创建16个平面的二值图像
	cv::Mat planes;
	convertToBinaryPlanes(newImage, planes, 16);
	//然后计算积分图像
	IntegralImage<float, 16> intHistogram(planes);
	double maxSimilarity = 0.0;
	int xbest = 0, ybest = 0;
	double distance = 0;
	cv::Mat histogram;
	for (int y = 0; y < newImage.rows; y++)
	{
		for (int x = 0; x < newImage.cols - 100; x++)
		{
			histogram = intHistogram(x, y, 100, 100);
			distance = cv::compareHist(refHistogram, histogram, CV_COMP_INTERSECT);
			if (distance > maxSimilarity)
			{
				xbest = x;
				ybest = y;
				maxSimilarity = distance;
			}
		}
	}
	cv::rectangle(newImage, cv::Rect(xbest, ybest, 100, 100), 0);
	cv::imshow("检测图像", newImage);
	cvWaitKey();

}