积分图的SSE和AVX2优化

仟人斩

已于 2022-04-05 22:22:23 修改

阅读量1.3k

点赞数

分类专栏：算法优化 opencv 算法实现文章标签： opencv 积分图

于 2022-04-05 22:20:21 首次发布

本文链接：https://blog.csdn.net/iamqianrenzhan/article/details/123977709

版权

本文探讨积分图在图像处理中的优化策略，从double、float到int类型的转换，再到逻辑优化、SSE和AVX2优化。通过这些优化，4k*2k图像的计算耗时从70ms逐步降低至2.5ms。详细介绍了AVX2优化的八个步骤，包括像素读取、移位、相加等操作，揭示了高效积分图算法的实现细节。

摘要由CSDN通过智能技术生成

积分图用double类型：

void IntegralF64(Mat src, Mat &integal_out)   
{
   
	Mat tmp(src.size(), CV_64FC1, 0.0);

	tmp.ptr<double>(0)[0] = (double)src.ptr<uchar>(0)[0];
	for (int i = 1; i < src.cols; i++)   //第一行    
	{
   
		tmp.ptr<double>(0)[i] = tmp.ptr<double>(0)[i - 1] + src.ptr<uchar>(0)[i];
	}

	for (int i = 1; i < src.rows; i++)  //第一列    
	{
   
		tmp.ptr<double>(i)[0] = tmp.ptr<double>(i - 1)[0] + src.ptr<uchar>(i)[0];
	}

	for (int i = 1; i < src.rows; i++)   //第i行    
	{
   
		for (int j = 1; j < src.cols; j++)   //第j列       
		{
   
			tmp.ptr<double>(i)[j] = tmp.ptr<double>(i)[j - 1] + tmp.ptr<double>(i - 1)[j] - tmp.ptr<double>(i - 1)[j - 1] + src.ptr<uchar>(i)[j];
		}
	}
	tmp.copyTo(integal_out);
}

该方法，对4k*2k的图，耗时在70ms。

积分图用float类型：

void IntegralF32(Mat src, Mat &integal_out)
{
   
	Mat tmp(src.size(), CV_32FC1, 0.0);

	tmp.ptr<float>(0)[0] = (float)src.ptr<uchar>(0)[0];
	for (int i = 1; i < src.cols; i++)   //第一行    
	{
   
		tmp.ptr<float>(0)[i] = tmp.ptr<float>(0)[i - 1] + src.ptr<uchar>(0)[i];
	}

	for (int i = 1; i < src.rows; i++)  //第一列    
	{