GCC的C编译器除了支持ANSI C标准之外,还对C语言进行了很多的扩充。这些扩充对代码优化、目标代码布局以及安全检查等方面提供了很强的支持,因此支持 GNU扩展的C语言称为GNU C语言。Linux 内核采用GCC编译器,所以Linux内核的代码自然使用了很多GCC的新扩充特性。
一、语句表达式
在GNUC语言中,括号里的复合语句可以看作一个表达式,称为语句表达式。在一个语句表达式里,可以使用循环、跳转和局部变量等。这个特性通常用在宏定义中,可以让宏定义变得更安全,如比较两个值的大小。
#define max(a,b) ((a) >(b) ? (a) : (b))
上述代码会导致安全问题,a和b有可能会计算两次,比如a传入i+,b传入j++。在GNUC语言中,如果知道a和b的类型,可以这样写这个宏。
#define maxint(a,b) \
({ int _a=(a),_b=(b);
_a > _b ?
_a : _b; })
如果不知道a和b的类型,还可以使用typeof类转换宏
#define min(x,y) ({
\
typeof(x) _min1 = (x); \
typeof(y) _min2 = (y); \
(void) (&min1 == &min2); \
_min1 < _min2 ? _minl : min2;})
typeof也是 GNU C语言的一个扩充用法,可以用来构造新的类型,通常和语句表达式起使用。
下面是一些例子。
typeof(*x) y;
typeof(*x) z[4];
typeof(typeof (char *)[4]) m;
第一句声明y是x指针指向的类型。第二句声明z是一个数组,其中数组的类型是x指针指向的类型,
第三句声明m是一个指针数组,和char*m[4]声明是一样的。
二、零长数组
GNUC语言允许使用变长数组,这在定义数据结构时非常有用
<mm/percpu.c>
struct pcpu_chunk{
struct ist headlist;
unsigned long
populated[];/*零长数组 */
};
数据结构最后一个元素被定义为零长度数组,不占结构体空间。我们可以根据对象大小动态地分配结构的大小。下面的例子来自GCC官网
struct line {
int length;
char contents[0];
};
struct line *thisline = (struct line *)
malloc (sizeof (struct line) + this_length);
thisline->length = this_length;
三、case范围
GNUC语言支持指定一个case的范围作为一个标签,此功能对ASCII字符特别有用,如:
case low ... high:
case 'A' .. 'Z':
另外,还可以用整形数来表示范围,但是需要注意在“…”两边有空格。如下:
case 1 ... 5:
下面的写法会出错
case 1...5: //...两边没有空格,语法错误
四、可变参数宏
在GNU C语言中, 宏可以接受可变数量的参数,这主要运用在输出函数里。
#define pr_debug(fmt, ...) \
dynamic_pr_debug(fmt, ##_VA_ARGS__)
“…”代表一个可以变化的参数表,“VA_ARGS ”是编译器保留字段,预处理时把参数传递给宏。当宏的调用展开时,实际参数就传递给dynamicpr debug函数了。
函数属性
GNUC语言允许声明函数属性(Function Attribute)变量属性(Variable Attribute)和类型属性(Type Attribute),以便编译器进行特定方面的优化和更仔细的代码检查。特殊属性语法格式为:
__attribute__ ((attribute-list))
GNUC语言里定义的函数属性有很多,如noreturn、format 以及const等。此外,还可以定义一些和处理器体系结构相关的函数属性,如ARM体系结构中可以定义interrupt、isr等属性,有兴趣的读者可以阅读 GCC 的相关文档。
noretum属性通知编译器,该函数从不返回值,这让编译器消除了不必要的警告信息比如 die 函数,该函数不会返回。
void __attribute((noreturn)) die(void);
const 属性会让编译器只调用该函数一次,以后再调用时只需要返回第一次结果即可从而提高效率。
Linux还有一些其他的函数属性,被定义在compiler-gcc.h文件中。
#define _pure __attribute__((pure))
#define aligned(x) __attribute__((aligned(x)))
#define printf(a,b) __attribute__((printf(a,b)))
#define scanf(a,b) __attribute__((scanf(a,b)))
#define noinline __attribute__((noinline))
#define
__attribute_const__ __attribute__((__const__))
#define __maybe_unused
__attribute__((unused))
#define __always_unsed
__attribute__((unused))
五、变量属性和类型属性
变量属性可以对变量或结构体成员进行属性设置。类型属性常见的属性有 alignment、packed和 sections 等alignment属性规定变量或者结构体成员的最小对齐格式,以字节为单位。
struct gib_user_info{
_u32 spu_userversion;
_u64 spu_base_info;
}__aligned(8);
在这个例子中,编译器以8字节对齐的方式来分配qib user info这个数据结构。
packed 属性可以使变量或者结构体成员使用最小的对齐方式,对变量是以字节对齐,对域是以位对齐。
struct test {
char a;
int x[2] __attribute
((packed));
}
x成员使用了packed 属性,它会存储在变量a后面,所以这个结构体一共占用9字节
六、内建函数
GNU C语言提供一系列内建函数进行优化,这些内建函数以“builtin ”作为函数名前
缀。下面介绍Linux内核常用的一些内建函数。
__builtin_constant_p(x):判断x是否在编译时就可以被确定为常量。如果x为常量,该函数返回1,否则返回0。
__builtin_expect(exp,c):这里的意思是exp=c的概率很大,用来引导GCC编译器进行条件分支预测。开发人员知道最可能执行哪个分支,并将最有可能执行的分支告诉编译器,让编译器优化指令序列,使指令尽可能地顺序执行,从而提高 CPU 预取指令的正确率
#define likely(x) __builtin_expect(!!(x), 1)
#define unlikely(x) __builtin_expect(!!(x), 0)
//与if一起使用
__builtin_prefetch(const void *addr int rw,int locality):主动进行数据预取,在使用地址addr 的值之前就把其值加载到 cache 中,减少读取的延迟,从而提高性能。该函数可以接受3个参数:第一个参数 addr 表示要预取数据的地址,第二个参数rw 表示读写属性,1表示可写,0表示只读,第三个参数 locality 表示数据在 cache 中的时间局部性,其中0表示读取完addr的之后不用保留在cache 中,而 1~3 表示时间局部性逐渐增强。如下面的 prefetch()和prefetchw()函数的实现。
#ifndef
ARCH_HAS_PREFETCH
#define prefetch(x) __builtin_prefetch(x)
#endif
#ifndef
ARCH_HAS_PREFETCHW
#define prefetchw(x) __builtin_prefetch(x,1)
#endif
七、UL
在 Linux 内核代码中,我们经常会看到一些数字的定义使用了UL后缀修饰。数字常量会被隐形定义为int类型,两个it类型相加的结果可能会发生溢出,因此使用UL强制把int类型数据转换为unsigned long类型,这是为了保证运算过程不会因为int的位数不同而导致溢出。