opencl:C++实现双线性插值图像缩放

用OpenCL实现图像缩放代码是比较简单的,因为OpenCL本身就支持双线性插值
下面是kernel代码(从Mali OpenCL SDK 抄来的:/samples/image_scaling/assets/image_scaling.cl)
非常简单只有4行

// 定义采样器 
// CLK_NORMALIZED_COORDS_TRUE指定使用归一化坐标
// CLK_ADDRESS_CLAMP 指定超出图像范围的颜色为黑色
// CLK_FILTER_LINEAR指定使用双线性插值
__constant sampler_t sampler = CLK_NORMALIZED_COORDS_TRUE | CLK_ADDRESS_CLAMP | CLK_FILTER_LINEAR;
__kernel void image_scaling(__read_only image2d_t sourceImage,
                            __write_only image2d_t destinationImage,
                            const float widthNormalizationFactor,
                            const float heightNormalizationFactor)
{
//从glob_id中获取目标像素坐标
    int2 coordinate = (int2)(get_global_id(0), get_global_id(1));
//计算归一化浮点坐标    
    float2 normalizedCoordinate = convert_float2(coordinate) * (float2)(widthNormalizationFactor, heightNormalizationFactor);
//根据归一化坐标从原图中读取像素数据
    float4 colour = read_imagef(sourceImage, sampler, normalizedCoordinate);
//将像素数据写入目标图像    
    write_imagef(destinationImage, coordinate, colour);
}

下面是主机代码片段

/* 向OpenCL设备中上传原始图像数据 */
void gray_matrix_cl::upload(const cl::CommandQueue& command_queue) const {
	cl::size_t<3> region;
	region[0] = width, region[1] = height, region[2] = 1;
	command_queue.enqueueWriteImage(cl_img,
	CL_TRUE, ZeroOffset, region, get_row_stride(), 0, (void*) pixels.data());
}
/* 从OpenCL设备中下载结果数据 */
void gray_matrix_cl::download(const cl::CommandQueue& command_queue) {
	cl::size_t<3> region;
	region[0] = width, region[1] = height, region[2] = 1;
	// 分配目标图像空间
	if (pixels.size() != get_row_stride() * height)
		pixels = std::vector<uint8_t>(get_row_stride() * height);
	command_queue.enqueueReadImage(cl_img,
	CL_TRUE, ZeroOffset, region, get_row_stride(), 0, (void*) pixels.data());
}
/* 缩放图像(双线性插值) 返回缩放后的图像数据*/
// facecl_context参见上一篇博客(http://blog.csdn.net/10km/article/details/50755251)
gray_matrix_cl gray_matrix_cl::zoom(size_t dst_width, size_t dst_height, const facecl_context& context)const {
	gray_matrix_cl dst_matrix(dst_width, dst_height);
	auto kernel = context.getKernel(KERNEL_NAME(image_scaling));// 获取已经编译好的cl::Kernel
	// 参见上一篇博客(http://blog.csdn.net/10km/article/details/50755251)
	auto command_queue = global_facecl_context.getCommandQueue();// 获取cl::CommandQueue
	this->upload(command_queue);//向OpenCL设备中上传原始图像数据
	cl_float widthNormalizationFactor = 1.0f / dst_width;
	cl_float heightNormalizationFactor = 1.0f / dst_height;
	// 设置kernel参数
	kernel.setArg(0, cl_img);
	kernel.setArg(1, dst_matrix.cl_img);
	kernel.setArg(2, widthNormalizationFactor);
	kernel.setArg(3, heightNormalizationFactor);
	const cl::NDRange global(dst_width, dst_height);
	// 执行 kernel
	command_queue.enqueueNDRangeKernel(kernel, gray_matrix_cl::NullRange, global);
	command_queue.finish();// 等待kernel执行结束
	dst_matrix.download(command_queue);// 从OpenCL设备中下载结果数据
	return std::move(dst_matrix);
}
  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
首先,你需要安装 Mali OpenCL SDK 并设置环境变量。你可以从 ARM 官网下载 Mali OpenCL SDK,并按照说明安装和设置环境变量。 接下来,你需要使用 Mali OpenCL 编译器编译你的 OpenCL 内核代码。Mali OpenCL 编译器的命令行工具为 `malioc`,你可以使用以下命令编译你的内核代码: ``` malioc -cl-std=CL1.2 -o kernel.bin kernel.cl ``` 其中,`-cl-std=CL1.2` 指定了 OpenCL 标准的版本号,`-o kernel.bin` 指定了输出文件名,`kernel.cl` 是你的 OpenCL 内核代码文件名。 然后,你需要在 OpenCV C++ 程序中添加 OpenCL 支持,并创建 OpenCL 上下文和命令队列。你可以使用以下代码来创建 OpenCL 上下文和命令队列: ``` cv::ocl::Context context; if (!context.create(cv::ocl::Device::TYPE_GPU)) { std::cout << "Failed creating the context..." << std::endl; return -1; } cv::ocl::Device(context.device(0)); cv::ocl::CommandQueue queue = cv::ocl::CommandQueue(context, context.device(0), CL_QUEUE_PROFILING_ENABLE); ``` 其中,`cv::ocl::Context` 类用于创建 OpenCL 上下文,`cv::ocl::Device::TYPE_GPU` 指定了使用 GPU 设备,`cv::ocl::Device` 类用于选择设备,`cv::ocl::CommandQueue` 用于创建命令队列。 接下来,你需要将 OpenCL 内核代码加载到程序中,并创建 OpenCL 内核对象。你可以使用以下代码来加载内核代码和创建内核对象: ``` std::ifstream kernelFile("kernel.bin", std::ios::binary); std::string kernelString((std::istreambuf_iterator<char>(kernelFile)), std::istreambuf_iterator<char>()); cv::ocl::ProgramSource programSource(kernelString); cv::ocl::Program program(programSource); if (!program.build()) { std::cout << "Failed building the program..." << std::endl; return -1; } cv::ocl::Kernel kernel("kernel_function", program); ``` 其中,`std::ifstream` 类用于从文件中读取内核代码,`cv::ocl::ProgramSource` 类用于创建 OpenCL 程序源码,`cv::ocl::Program` 类用于创建 OpenCL 程序对象,`program.build()` 函数用于编译内核代码,`cv::ocl::Kernel` 类用于创建内核对象。 最后,你可以使用 OpenCL 内核对象来实现 GPU 加速的算法。你可以使用以下代码来在 GPU 上执行内核代码: ``` cv::UMat src, dst; src = cv::imread("input.jpg", cv::IMREAD_GRAYSCALE); cv::UMat result(src.size(), CV_8U); cv::UMat src_gpu = src.getUMat(cv::ACCESS_READ, cv::USAGE_ALLOCATE_DEVICE_MEMORY); cv::UMat dst_gpu = dst.getUMat(cv::ACCESS_WRITE, cv::USAGE_ALLOCATE_DEVICE_MEMORY); kernel.set(0, cv::ocl::oclMat(src_gpu)); kernel.set(1, cv::ocl::oclMat(dst_gpu)); kernel.set(2, result.cols); kernel.set(3, result.rows); cv::ocl::Event event; queue.enqueueNDRangeKernel(kernel, cv::NullRange, cv::NDRange(src.cols, src.rows), cv::NullRange, NULL, &event); cv::Mat result_cpu; result.copyTo(result_cpu); cv::imshow("Result", result_cpu); ``` 其中,`cv::UMat` 类用于分配 OpenCL 设备内存,`cv::ocl::oclMat` 类用于将 UMat 对象转换为 OpenCL 内存对象,`kernel.set()` 函数用于设置内核函数的参数,`cv::ocl::Event` 类用于记录内核函数的运行时间,`queue.enqueueNDRangeKernel()` 函数用于启动内核函数。 需要注意的是,在使用 OpenCL 加速的算法中,你需要将图像数据从 CPU 内存复制到 GPU 内存,并在完成计算后将结果从 GPU 内存复制回 CPU 内存。这可能会带来一定的额外开销,因此你需要权衡计算复杂度和数据传输开销。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

10km

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值