今天，你被编译器耍了么？

最新推荐文章于 2020-11-25 16:27:00 发布

itlmy

最新推荐文章于 2020-11-25 16:27:00 发布

阅读量840

点赞数

分类专栏： DirectX HLSL编译器游戏开发文章标签：编译器 float 优化 vector compiler

本文链接：https://blog.csdn.net/itlmy/article/details/6968881

版权

DirectX 同时被 3 个专栏收录

2 篇文章 0 订阅

订阅专栏

游戏开发

2 篇文章 0 订阅

订阅专栏

HLSL编译器

1 篇文章 0 订阅

订阅专栏

你以为你很会耍小聪明，你以为你的代码能优化性能，事实真的如此么？答：You’re Fucked!
请看如下HLSL代码：

for(int x=-1; x<=1; x+=2)
for(int y=-1; y<=1; y+=2)
for(int z=-1; z<=1; z+=2)
{
	float3 vOffset = normalize(float3(x, y, z))*offsetScale;
	.
	.
	.
}

看到这里，你有没有想过可能的优化呢，一个if语句2个GPU时钟，很多人都不挺地告诫你，慎用分支语句。于是，你写下了下面的代码：

#define NUM_OFFSET_VECTORS 27
	const float3 OFFSET_VECTOR[NUM_OFFSET_VECTORS] = {
		float3(-1,-1,-1),
		float3(-1,-1,1),
		float3(-1,-1,3),
		
		float3(-1,1,-1),
		float3(-1,1,1),
		float3(-1,1,3),
		
		float3(-1,3,-1),
		float3(-1,3,1),
		float3(-1,3,3),
		
		float3(1,-1,-1),
		float3(1,-1,1),
		float3(1,-1,3),
		
		float3(1,1,-1),
		float3(1,1,1),
		float3(1,1,3),
		
		float3(1,3,-1),
		float3(1,3,1),
		float3(1,3,3),
		
		
		float3(3,-1,-1),
		float3(3,-1,1),
		float3(3,-1,3),
		
		float3(3,1,-1),
		float3(3,1,1),
		float3(3,1,3),
		
		float3(3,3,-1),
		float3(3,3,1),
		float3(3,3,3)		
	};

for(int j=0; j<NUM_OFFSET_VECTORS; j++)
{
	float3 vOffset = normalize(OFFSET_VECTOR[j])*offsetScale;
	.
	.
	.
}

我只用了224个常量寄存器中的27个，就减少了2层分支，这下帧速应该上去了吧，为什么帧速反而下降了呢？
因为你丫被编译器骗了！

“优化”后的代码

“优化”前的代码

编译器把你“优化”后的代码直接展开了，就是它确实没有做条件分支，而是重复了27边相同的GPU指令！！！
“优化”前它帮你编译出95条指令，优化后它帮你编出了466条指令！！！
Compiler is like a box of chocolate, you never know what you will get!

itlmy

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
今天，你被编译器耍了么？

你以为你很会耍小聪明，你以为你的代码能优化性能，事实真的如此么？答：You’re Fucked!请看如下HLSL代码：for(int x=-1; x<=1; x+=2)for(int y=-1; y<=1; y+=2)for(int z=-1; z<=1; z+=2){ float3 vOffset = normalize(float3(x, y, z))*offsetSc
复制链接

扫一扫