本文摘自:
http://www.oschina.net/question/32294_53573
由于
restrict
是C99引入的新关键字,目前Linux的ManPage还没有更新,所以都没有
restrict
关键字,本书的函数原型都取自ManPage,所以也都没有restrict关键字。但在C99标准中库函数的原型都在必要的地方加了restrict关键字,在
C99
中memcpy的原型是
void*
memcpy
(void * restrict s1, const void * restrict s2,size_t n);
,就是告诉调用者,这个函数的实现可能会做些优化,编译器也可能会做些优化,传进来的指针不允许指向重叠的内存区间,否则结果可能是错的,而memmove的原型是
void*
memmove
(void *s1, const void *s2, size_tn);
,没有restrict关键字,说明传给这个函数的指针允许指向重叠的内存区间。在restrict关键字出现之前都是用自然语言描述哪些函数的参数不允许指向重叠的内存区间,例如在C89标准的库函数一章开头提到,本章描述的所有函数,除非特别说明,都不应该接收两个指针参数指向重叠的内存区间,例如调用sprintf时传进来的格式化字符串和结果字符串的首地址相同,诸如此类的调用都是非法的。本书也遵循这一惯例,除非像memmove这样特别说明之外,都表示“不允许”。
restrict是C99引入的新关键字,它用于
声明只会通过该指针对其指向的内存空间进行读写操作,以便编译器能进行更好的优化。
我们来看一个跟memcpy/memmove类似的问题。下面的函数将两个数组中对应的元素相加,结果保存在第三个数组中。
void
vector_add
(
const
double
*
x
,
const
double
*
y
,
double
*
result
)
{
int
i
;
for
(
i
=
0
;
i
<</span>64; ++i)
result
[
i
]
=
x
[
i
]
+
y
[
i
];
}
如果这个函数要在多处理器的计算机上执行,编译器可以做这样的优化:把这一个循环拆成两个循环,一个处理器计算i值从0到31的循环,另一个处理器计算i值从32到63的循环,这样两个处理器可以同时工作,使计算时间缩短一半。但是这样的编译优化能保证得出正确结果吗?假如result和x所指的内存区间是重叠的,result[0]其实是x[1],result[i]其实是x[i+1],这两个处理器就不能各干各的事情了,因为第二个处理器的工作依赖于第一个处理器的最终计算结果,这种情况下编译优化的结果是错的。这样看来编译器是不敢随便做优化了,那么多处理器提供的并行性就无法利用,岂不可惜?为此,C99引入restrict关键字,如果程序员把上面的函数声明为
void vector_add(const double *restrict x, constdouble *restrict y, double *restrict result)
,就是告诉编译器可以放心地对这个函数做优化,程序员自己会保证这些指针所指的内存区间互不重叠。