pragma UNROLL的用法

#pragma UNROLL 4
在图像处理程序中,你会看到类似于#pragma unroll 4这样的语句(注:在DX中,也许你会见到[unroll(3)] for(int i = 0;i < Total; i++)类似情况),现具体解释如下:


语法:

#pragma UNROLL(n)

#pragma UNROLL告诉编译器一个循环中应该展开n次(其实我觉得是告诉编译器循环展开n次是安全的),有助于对那些不容易展开的循环有更大概率的进行软件流水。

其实很多很多时候编译器会自动判断各种信息,但是这增加了冗余开销,反倒不如直接把我们优化工程师知道的东西告诉编译器。

例:

int JackeryTest [160];

#pragma unroll(4)

for(int i=0;i<160;i )

{

JackeryTest [i]=i;

}

此处你应该知道在GPU处理过程中,对像素点的操作是并行操作的,所以在Shader中,可以看到这样的处理方式,来提高程序执行效!上面代码就告诉了编译器循环中展开4次并行执行的循环是安全的,如果编译器的软件流水可以顺利打开且不考虑软件流水填充和排空,那么上面代码就相当于如下代码并行执行,

for(int i=0;i<160;i +=4)

JackeryTest [i]=i; //并行

JackeryTest [i +1]=i +1; //并行

JackeryTest [i +2]=i +2; //并行

JackeryTest [i +3]=i +3; //并行

注意:

(1) 循环的次数是n的整数倍

(2) 其实一般都是和#pragma MUST_INTERATE配合使用,这样可以更全面的告诉编译器我们知道的信息,以使编译器有效开通软件流水。

(3) #pragma MUST_INTERAT(1)告知编译器不要进行循环展开。

(4) 不要使用多条#pragma MUST_INTERAT语句,这样做的话编译器不一定执行的是那条#pragma MUST_INTERAT

(5) 如果设置了-O1,-O2,-O3等编译选项则#pragma UNROLL(n)的设置是无效的

  • 4
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
`#pragma` 的使用方法如下: ```c++ #pragma 指令名 [指令参数] ``` 其中,`指令名` 表示要执行的 `#pragma` 指令的名称,可以是编译器提供的预定义指令,也可以是用户自定义的指令;而 `指令参数` 则是指令的参数,不同的指令可以接受不同的参数。 下面以 `#pragma once` 和 `#pragma pack` 为例,介绍 `#pragma` 的具体使用方法。 1. 防止头文件被重复包含 `#pragma once` 可以用于防止头文件被重复包含。例如,我们有一个头文件 `my_header.h`,内容如下: ```c++ #ifndef MY_HEADER_H #define MY_HEADER_H // 头文件内容 #endif ``` 这是常见的防止头文件被重复包含的写法。但其实还有一种更加简单的方式,就是使用 `#pragma once` 指令。只需要在头文件的开头加上一行 `#pragma once`,就可以达到同样的效果,如下所示: ```c++ #pragma once // 头文件内容 ``` 2. 控制结构体字节对齐方式 `#pragma pack` 可以控制结构体的字节对齐方式。例如,我们有一个结构体 `MyStruct`,定义如下: ```c++ struct MyStruct { char a; int b; short c; }; ``` 默认情况下,编译器会按照“自然对齐”的方式来对结构体进行字节对齐,即按照结构体成员的大小和类型自动调整对齐方式。但是,如果我们希望手动控制结构体的字节对齐方式,可以使用 `#pragma pack` 指令。例如,我们希望将结构体 `MyStruct` 的字节对齐方式设置为 1,可以这样写: ```c++ #pragma pack(1) struct MyStruct { char a; int b; short c; }; ``` 这样,编译器就会按照 1 字节的对齐方式来对结构体进行字节对齐。注意,使用 `#pragma pack` 指令可能会影响程序的性能和可移植性,应该谨慎使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值