OpenGL计算着色器工作组设置测试

最新推荐文章于 2024-02-20 13:36:24 发布

奋起无痕

最新推荐文章于 2024-02-20 13:36:24 发布

阅读量1.1k

点赞数 1

分类专栏： OpenGL OpenCV学习记录

本文链接：https://blog.csdn.net/qq_26328385/article/details/105601066

版权

OpenGL OpenCV学习记录专栏收录该内容

27 篇文章 2 订阅

订阅专栏

先看看不同的显卡上工作组的数量情况。

	glGetIntegeri_v(GL_MAX_COMPUTE_WORK_GROUP_COUNT, 0, data);
	glGetIntegeri_v(GL_MAX_COMPUTE_WORK_GROUP_COUNT, 1, data + 1);
	glGetIntegeri_v(GL_MAX_COMPUTE_WORK_GROUP_COUNT, 2, data + 2);
	
	glGetIntegerv(GL_MAX_COMPUTE_WORK_GROUP_INVOCATIONS,data + 3);
	glGetIntegeri_v(GL_MAX_COMPUTE_WORK_GROUP_SIZE, 0, data + 4);
	glGetIntegeri_v(GL_MAX_COMPUTE_WORK_GROUP_SIZE, 1, data + 5);
	glGetIntegeri_v(GL_MAX_COMPUTE_WORK_GROUP_SIZE, 2, data + 6);

	cout << "GL_MAX_COMPUTE_WORK_GROUP_COUNT:" << data[0] << " " << data[1] << " " << data[2] << endl;
	cout << "GL_MAX_COMPUTE_WORK_GROUP_INVOCATIONS:" << data[3] << endl;
	cout << "GL_MAX_COMPUTE_WORK_GROUP_SIZE:" << data[4] << " " << data[5] << " " << data[6] << endl;

集成显卡：
在这里插入图片描述
高性能INVIDIA处理器：

很明显独显可设置的工作组数量要比集成显卡多一些。先看一下相同的维度下集成显卡和独显的运行时间(毫秒)。

glDispatchCompute(8000, 1, 1);
//着色器设置
layout (local_size_x = 1024,local_size_y = 1) in;

集成：
在这里插入图片描述
独显：

很明显，独显的运行速度要比集成显卡快很多。
再在集成显卡下，修改一下工作组维度看下。

glDispatchCompute(20, 20, 20);
//着色器设置
layout (local_size_x = 256,local_size_y = 2,local_size_z = 2) in;

在这里插入图片描述
本地工作组的积都是1024的时候，好像并没有什么的改善。。。。。。。也许只要设置成x单维的，用gl_GlobalInvocationID.x做为索引就行。。。
再试下把本地工作组的值减小：

glDispatchCompute(64000, 1, 1);
layout (local_size_x = 128,local_size_y = 1) in;

在这里插入图片描述
再对比一下感觉31和32占的比例明显增多。个人认为还是最好把本地工作组设成一个显卡能支持的最大值，但是不同的显卡支持的最大值又不同，该怎么设置?
https://blog.csdn.net/DSQ_17/article/details/21457507

奋起无痕

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
OpenGL计算着色器工作组设置测试

先看看不同的显卡上工作组的数量情况。 glGetIntegeri_v(GL_MAX_COMPUTE_WORK_GROUP_COUNT, 0, data); glGetIntegeri_v(GL_MAX_COMPUTE_WORK_GROUP_COUNT, 1, data + 1); glGetIntegeri_v(GL_MAX_COMPUTE_WORK_GROUP_COUNT, 2, data...
复制链接

扫一扫