opencl:一个关于向量赋值的异常

10km

已于 2024-01-02 10:53:38 修改

阅读量1.9k

点赞数

分类专栏： opencl 文章标签： opencl kernel 向量赋值 vstore vector

于 2016-04-17 11:28:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/10km/article/details/51172345

版权

opencl 专栏收录该内容

26 篇文章 9 订阅

订阅专栏

在项目中，有一个下面这样的数据结构，storage保存是个float4类型的数组。

typedef struct _detected_objects_buffer {
	cl_float4 storage[MAX_DETECTED_OBJECT_NUM];
	cl_int 	detected_num;
	kernel_error status;
}detected_objects_buffer;

这个结构对象的指针，在执行kernel函数的时候，会做为__global指针参数传递给kernel.
kernel中会向storage数组中写入输出数据。kernel执行结束后，主机端读取这个结构体的数据。
下面是kernel中向storage数组中写入输出数据的部分代码：

inline void copy_detected_obj_to_host(const __local int4* detected_obj
	, __global detected_objects_buffer* out
	, int object_num	
	, const int win_size
	, const int dist_size
	, const int2 img_size){	
	...//其他代码
	float4 obj;
	for(int i=0; i < object_num  ; ++i){
		...//其他代码
		//向__global指针写入向量数据之方法一：直接赋值	
		out->storage[out->detected_num+i]=obj;
		//向__global指针写入向量数据之方法二：调用vstore函数	
		vstore4( obj ,out->detected_num+i,(__global float*)out->storage);// 
		...//其他代码
	}	
}

当为detected_objects_buffer创建cl::Buffer时，如果cl_mem_flags设置为CL_MEM_USE_HOST_PTR(即kernel直接使用主机内存地址的数据)，则上述kernel代码中方法一会抛出异常。
当为detected_objects_buffer创建cl::Buffer时，如果cl_mem_flags设置为CL_MEM_COPY_HOST_PTR(即将主机数据复制到opencl设备内存)，则上述kernel代码中方法一和方法二都能正常执行。
看过opencl的官方原文档，没有找到关于方法一这种直接赋值方式的使用限制说明。
我目前用的opencl驱动是AMD APP SDK,现在不清楚，这是amd驱动的bug，还是确实不能这样使用。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

10km

CSDN认证博客专家 CSDN认证企业博客

码龄23年

654: 原创

5934: 周排名

609: 总排名

353万+: 访问

: 等级

3万+: 积分

1万+: 粉丝

1785: 获赞

1040: 评论

3687: 收藏

私信

关注

热门文章

分类专栏

aocache 5篇
aspect 6篇
sql2java 8篇
CMake进阶 42篇
sql 4篇
ANTLR 4篇
攻玉之器 19篇
conan 39篇
macOS 5篇
MiniGUI 23篇
开发工具 126篇
rpc 33篇
代码生成 10篇
opencl 26篇
cmake 83篇
script 60篇
java 229篇
c/c++/c++11 106篇
jpeg 20篇
ui 24篇
databinding 14篇
system 37篇
deeplearning 26篇
python 4篇
json 23篇
thrift 16篇
embedded 23篇
minigui 23篇

最新评论

spring:拦截器(HandlerInterceptor)中获取POST请求参数
阿J~: 不错不错！反手就是一个赞，欢迎回评哦~
commons-configuration2:properties文件写入中文(no escape)
10km: 确实，今天特别写测试代码验证了一下，PropertiesConfiguration.JupIOFactory实现了同样的功能，2017年写这篇文章的时候，commons-configuration2还是2.2,看来这个非转义特性也是普遍需求，所以官方对后续版本改进了，开发者不用再重复造轮子了。感谢提醒。我会更新本文说明。
commons-configuration2:properties文件写入中文(no escape)
JayHooz: 2.4版本之后，PropertiesConfiguration自身实现的JupIOFactory，支持不使用unicode转义，更贴合java.util.properties能力
openjpeg:jpeg2000(j2k)图像内存解压缩(解码)
10km: 恭喜成功，其实jpegwrapper仓库代码不需要做任何修改，只要把common_source仓库，切换到common_source_cpp-1.0.2 tag,执行conan create .,在本地仓库创建1.0.2的recpe,jpegwrapper就能正常编译。关于vs2022/2019,因为商业版权问题，我以后不再用了，我也没安装，不会再更新。使用者自己改make_msvc_project.bat也不复杂。
openjpeg:jpeg2000(j2k)图像内存解压缩(解码)
丁金金: 使用 conan create . ，需要更新为common_source_cpp/1.0.3-dev ，同时使用conan安装common_source_cpp本地库,再把image_matrix_types.cpp移动到 jpegwrapper文件夹下终于成功了，但是还是很希望博主出一个cmake和最新的，多谢了vs2022或者vs2019的教程。

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

10km 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。