GraphicsMagick 的 OpenCL 开发记录(三十七)

本文讨论了如何改进ScaleImage的硬件加速函数,包括解决代码随意性问题、优化内存使用以及考虑工作-item间的同步。作者分享了commit中的新修订版本,探讨了Y方向缩放的处理方式和内存共享问题。
摘要由CSDN通过智能技术生成

<2022-05-06 周五>

如何写ScaleImage()的硬件加速函数(十一)

如何写ScaleImage()的硬件加速函数(十)”这里的代码写得比较随意,其中stopi = 0;赋值为0后,下面的循环根本没有执行,这才使得显示的图片变正确了;且async_work_group_copy()的参数传得可能也不对,等等等。

  1. 我原来的想法是在外部计算好需要的行数传入kernel函数,并按照此行数申请好一定长度的一维数组,在async_work_group_copy()时拷贝相应行数的像素。
  2. 然后在async_work_group_copy()拷贝好的local内存里按照ScaleImage()的算法实现Y方向的缩放。
  3. 有一个顾虑需不需要考虑?因为local内存是对应一个work-group的,它的各work-item共享这片local内存,那每个work-item是不是都会按照ScaleImage()的算法处理一次Y方向的缩放?
  4. 目前看好像不要考虑这个问题,即不影响结果也不影响效率。
  5. 同时也在考虑,可不可以在进入kernel函数之前就缩放好Y方向呢?

commita better revision of AccelerateScaleImage()
在这里插入图片描述

  • 8
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值