位段详解
1. 什么是位段
有些数据在存储时并不需要占用一个完整的字节,只需要占用一个或几个二进制位即可。例如开关只有通电和断电两种状态,用 0 和 1 表示足以,也就是用一个二进位。正是基于这种考虑,C语言又提供了一种叫做位段(位域)的数据结构。
2. 位段的声明
位段定义与结构定义相仿,需要注意一下两点:
-
位段的成员必须是 int、signed int 和 unsigned int(int 默认就是 signed int)类型
-
位段的成员名后边有一个冒号和一个数字。
请看下面的例子:
struct bs
{
unsigned m;
unsigned n: 4;
unsigned char ch: 6;
};
C语言标准规定,位段的宽度不能超过它所依附的数据类型的长度。通俗地讲,成员变量都是有类型的,这个类型限制了成员变量的最大长度,:
后面的数字不能超过这个长度。
成员 m 没有限制,根据数据类型即可推算出它占用 4 个字节(Byte)的内存。
成员 n、ch 被:
后面的数字限制,不能再根据数据类型计算长度,它们分别占用 4、6 位(Bit)的内存。
注意:
虽然C语言标准规定,只有 int、signed int 和 unsigned int(int 默认就是 signed int)类型支持位段,但编译器在具体实现时都进行了扩展,额外支持了 char、signed char、unsigned char 以及 enum 类型,所以上面的代码虽然不符合C语言标准,但它依然能够被编译器支持。
3. 位段的内存分配
C语言标准并没有规定位段的具体存储方式,不同的编译器有不同的实现,但它们都尽量压缩存储空间。
位段的具体存储规则如下:
-
当相邻成员的类型相同时,如果它们的位宽之和小于类型的 sizeof 大小,那么后面的成员紧邻前一个成员存储,直到不能容纳为止;如果它们的位宽之和大于类型的 sizeof 大小,那么后面的成员将从新的存储单元开始,其偏移量为类型大小的整数倍。
以下面的位段 bs 为例:
struct bs{ unsigned m: 6; unsigned n: 12; unsigned p: 4; };
运行结果:
4
(1)m、n、p 的类型都是 unsigned int,sizeof 的结果为 4 个字节(Byte),也即 32 个位(Bit)。m、n、p 的位宽之和为 6+12+4 = 22,小于 32,所以它们会挨着存储,中间没有缝隙。
(2) 如果将成员 m 的位宽改为 22,那么输出结果将会是 8,因为 22+12 = 34,大于 32,n 会从新的位置开始存储,相对 m 的偏移量是 sizeof(unsigned int),也即 4 个字节。
(3) 如果再将成员 p 的位宽也改为 22,那么输出结果将会是 12,三个成员都不会挨着存储。
-
当相邻成员的类型不同时,不同的编译器有不同的实现方案,GCC 会压缩存储,而 VC/VS 不会。
请看下面的位段 bs 为例:
struct bs { unsigned m: 12; unsigned char ch: 4; unsigned p: 4; };
在 GCC 下的运行结果为 4,三个成员挨着存储;
在 VC/VS 下的运行结果为 12,三个成员按照各自的类型存储。这是因为VC/VS 采用了内存对齐策略。
-
如果成员之间穿插着非位段成员,那么不会进行压缩。
例如对于下面的 bs:
struct bs { unsigned m: 12; unsigned ch; unsigned p: 4; };
在各个编译器下 sizeof 的结果都是 12。
通过上面的分析,我们发现位段成员往往不占用完整的字节,有时候也不处于字节的开头位置,因此使用&
获取位段成员的地址是没有意义的,C语言也禁止这样做。地址是字节(Byte)的编号,而不是位(Bit)的编号。
4. 无名位段
位段成员可以没有名称,只给出数据类型和位宽,如下所示:
struct bs
{
int m: 12;
int : 20; //该位段成员不能使用
int n: 4;
};
无名位段一般用来作填充或者调整成员位置。因为没有名称,无名位段不能使用。
上面的例子中,如果没有位宽为 20 的无名成员,m、n 将会挨着存储,sizeof(struct bs) 的结果为 4;
有了这 20 位作为填充,m、n 将分开存储,sizeof(struct bs) 的结果为 8。
4. 位段的使用
位段的使用和结构成员的使用相同,其一般形式为:
位段变量名.位段名
位段变量名->位段名
位段允许用各种格式输出,请看下面实例:
int main()
{
struct bs
{
unsigned a:1;
unsigned b:3;
unsigned c:4;
} bit,*pbit;
bit.a=1;
bit.b=7;
bit.c=15; // 给位段赋值(应注意赋值不能超过该位段的允许范围)
printf("%d,%d,%d\n",bit.a,bit.b,bit.c); // 以整型量格式输出三个段的内容
pbit=&bit; // 把位段变量 bit 的地址送给指针变量 pbit
pbit->a=0; // 用指针方式给位段 a 重新赋值,赋为 0
pbit->b&=3; // 位段 b 中原有值为 7,与 3 作按位与运算
pbit->c|=1; // 位段 c 中原有值为 15,与 1 作按位或运算
printf("%d,%d,%d\n",pbit->a,pbit->b,pbit->c);// 用指针方式输出了这三个段的值
}