深入剖析位结构

最新推荐文章于 2012-10-23 16:13:19 发布

benny5609

最新推荐文章于 2012-10-23 16:13:19 发布

阅读量1.1k

点赞数

分类专栏： C/C++ 文章标签： struct class motorola 存储编译器 ibm

本文链接：https://blog.csdn.net/benny5609/article/details/1805486

版权

C/C++ 专栏收录该内容

82 篇文章 1 订阅

订阅专栏

keyword: 位结构节省存贮空间 “:”操作符位域

一、首先说概念：

位结构是一种特殊的结构, 在需按位访问一个字节或字的多个位时, 位结构比按位运算符更加方便。
位结构定义的一般形式为:
struct 位结构名{
数据类型 [变量名]: 整型常数; //成员称为“位域”或者“位段”
数据类型 [变量名]: 整型常数;
} 位结构变量;
其中: 数据类型必须是整型(int/char/short)。整型常数的范围是数据类型的长度, 如定义为short，则范围是1~16。
变量名是选择项, 可以不命名, 这样规定是为了排列需要。
例如: 下面定义了一个位结构。
struct webpage{
unsigned char incon: 8; /*incon占用低字节的0~7共8位*/
unsigned char txcolor: 4;/*txcolor占用高字节的0~3位共4位*/
unsigned char bgcolor: 3;/*bgcolor占用高字节的4~6位共3位*/
unsigned char blink: 1; /*blink占用高字节的第7位*/
}ch;
printf("%d/n",sizeof(struct webpage));输出：2。
位结构成员的访问与结构成员的访问相同。
例如: 访问上例位结构中的bgcolor成员可写成:
ch.bgcolor

注意:
1. 一个位域必须存储在定义它的一个数据类型内部，不能跨跨该数据类型。如char定义的位域所剩空间不够存放另一位域时，应从下一单元起存放该位域。也可以有意使某位域从下一单元开始。
2.由于位域不允许越过定义它的数据类型，因此位域的长度不能大于定义它的数据类型的长度。
3. 位结构总长度(位数), 是各个位成员定义的位数之和再向最大结构成员对齐。
4. 位结构成员可以与其它结构成员一起使用。
例如:
struct info{
char name[8];
int age;
struct addr address;
float pay;
unsigned char state: 1;
unsigned char pay: 1;
}workers;
上例的结构定义了关于一个工人的信息。其中有两个位结构成员, 每个位结构成员只有一位, 用unsigned char数据类型，因此只占一个字节但保存了两个信息, 该字节中第一位表示工人的状态, 第二位表示工资是否已发放。由此可见使用位结构可以节省存贮空间。

二、再说说位结构的位域存储顺序问题

我们知道字节存储顺序有高字节优先的big-endian大端存储法（高字节数据放在低字节地址处）和低字节优先的little-endian小端存储法，无论使用大端法还是小端法，都不存在技术原因，只是涉及到处理器厂商的立场和习惯。INTEL的X86平台使用小端法，IBM、Motorola、Sun Microsystem的大多数微处理器则使用大端法，还有部分微处理器可以由用户自己设置是使用大端法还是小端法，如ARM、MIPS、PowerPC等。
位域在存储时的顺序和它的编译器有关，一般是先申请的放在低位。程序举例如下：
#include "stdio.h"
void main()
{
union
{
struct student
{
unsigned char s1:1;
unsigned char s2:3;
}x;
unsigned char c;
}v;
v.c=0;
v.x.s1=0;
v.x.s2=4;
printf("%d/n",v.c);
printf("%d/n",sizeof(struct student));
}
输出：
8
1

即结构体成员申请是按照顺序从低地址开始。所以上边结构体v在内存中数据的排列顺序为

    s1 s2
    |0| 0|0|1| 0|0|0|0| （1个字节，因为是unsigned char类型）
低地址       高地址

s1放着0
s2放着4（二进制100），在内存里由低到高为“|0|0|1|”。
所以v.c为二进制00001000，即十进制8。
同时，因为s1占一个位，s2占三个位，而两者都是unsigned char型，且最大的数据类型也就是unsigned char型，一个字节足够放下s1和s2了。所以我们看到struct student的大小为1个字节。
如果从先申请的放在高字节，则上边的输出为
s2 s1
0000 |001 |0
即输出应该是：
64
1
网上有人说TURBO C是采用这种方式，我没试过。

三、位结构的位对齐问题
位结构的其实不存在位对齐问题，即位不需要对齐。其他方面，位结构和一般结构体类似，遵循结构体的对齐原则，

#include "stdio.h"

void main()
{
union
{
struct student
{
unsigned char s1:1;
unsigned char s2:2;
unsigned char s3:2;
}x;
unsigned char c;
}v;
v.c=0;
v.x.s1=0;
v.x.s3=2;
printf("%d/n",v.c);
printf("%d/n",sizeof(struct student));
}
输出结果是：
16
1

因为它只按整体对齐，所以为
s1s2s3
0 0001000
即二进制00010000等于十进制16，而不是
s1s2 s3
0 00 0 01 00

再举一个位结构体的例子

#include "stdio.h"
void main()
{
union
{
struct student
{
unsigned char s1:1;
unsigned char s2:2;
unsigned short s3:2;
}x;
unsigned short c;
unsigned int d;
}v;
v.d=0;
v.x.s1=0;
v.x.s3=2;
printf("%d/n",v.d);
printf("%d/n",sizeof(struct student));
}
输出为：
131072
4

131072=(10 00000000 00000000)b
因为遵循结构体对齐原则，s3跳过了2个字节。
s1s2 s3
0 00 00000| 00000000| 01

有关“结构体对齐”可以看转载
"52rd.com/Blog/Detail_RD.Blog_zjhfqq_7083.html"

以上程序全部在C1.7 + XPSP2 + VC6++测试通过。

本文原创，转载请注明出处。
"52rd.com/Blog/Detail_RD.Blog_zjhfqq_7084.html"

阅读全文(862) | 回复(1) | 引用(0)

回复:深入剖析位结构

Andrew(游客)发表评论于2007-4-12 15:17:00

最后一个例子,如果对齐为1( 即pragma pack(1) ),在X86机器上的打印结果是: 512 3 另外,如果在big endian机器上,打印的值应该也不一样.

朋友帖了如下一段代码：
　　#pragma pack(4)
　　class TestB
　　{
　　public:
　　　　int aa;
　　　　char a;
　　　　short b;
　　　　char c;
　　};
　　int nSize = sizeof(TestB);
　　这里nSize结果为12，在预料之中。

　　现在去掉第一个成员变量为如下代码：
　　#pragma pack(4)
　　class TestC
　　{
　　public:
　　　　char a;
　　　　short b;
　　　　char c;
　　};
　　int nSize = sizeof(TestC);
　　按照正常的填充方式nSize的结果应该是8，为什么结果显示nSize为6呢？

事实上，很多人对#pragma pack的理解是错误的。
#pragma pack规定的对齐长度，实际使用的规则是：
结构，联合，或者类的数据成员，第一个放在偏移为0的地方，以后每个数据成员的对齐，按照#pragma pack指定的数值和这个数据成员自身长度中，比较小的那个进行。
也就是说，当#pragma pack的值等于或超过所有数据成员长度的时候，这个值的大小将不产生任何效果。
而结构整体的对齐，则按照结构体中最大的数据成员和 #pragma pack指定值之间，较小的那个进行。

具体解释
#pragma pack(4)
　　class TestB
　　{
　　public:
　　　　int aa; //第一个成员，放在[0,3]偏移的位置，
　　　　char a; //第二个成员，自身长为1，#pragma pack(4),取小值，也就是1，所以这个成员按一字节对齐，放在偏移[4]的位置。
　　　　short b; //第三个成员，自身长2，#pragma pack(4)，取2，按2字节对齐，所以放在偏移[6,7]的位置。
　　　　char c; //第四个，自身长为1，放在[8]的位置。
　　};
这个类实际占据的内存空间是9字节
类之间的对齐，是按照类内部最大的成员的长度，和#pragma pack规定的值之中较小的一个对齐的。
所以这个例子中，类之间对齐的长度是min(sizeof(int),4)，也就是4。
9按照4字节圆整的结果是12，所以sizeof(TestB)是12。

如果
#pragma pack(2)
class TestB
　　{
　　public:
　　　　int aa; //第一个成员，放在[0,3]偏移的位置，
　　　　char a; //第二个成员，自身长为1，#pragma pack(4),取小值，也就是1，所以这个成员按一字节对齐，放在偏移[4]的位置。
　　　　short b; //第三个成员，自身长2，#pragma pack(4)，取2，按2字节对齐，所以放在偏移[6,7]的位置。
　　　　char c; //第四个，自身长为1，放在[8]的位置。
　　};
//可以看出，上面的位置完全没有变化，只是类之间改为按2字节对齐，9按2圆整的结果是10。
//所以 sizeof(TestB)是10。

最后看原贴：
现在去掉第一个成员变量为如下代码：
　　#pragma pack(4)
　　class TestC
　　{
　　public:
　　　　char a;//第一个成员，放在[0]偏移的位置，
　　　　short b;//第二个成员，自身长2，#pragma pack(4)，取2，按2字节对齐，所以放在偏移[2,3]的位置。
　　　　char c;//第三个，自身长为1，放在[4]的位置。
　　};
//整个类的大小是5字节，按照min(sizeof(short),4)字节对齐，也就是2字节对齐，结果是6
//所以sizeof(TestC)是6。

感谢 Michael 提出疑问，在此补充：

当数据定义中出现__declspec( align() )时，指定类型的对齐长度还要用自身长度和这里指定的数值比较，然后取其中较大的。最终类/结构的对齐长度也需要和这个数值比较，然后取其中较大的。

可以这样理解， __declspec( align() ) 和 #pragma pack是一对兄弟，前者规定了对齐的最小值，后者规定了对齐的最大值，两者同时出现时，前者拥有更高的优先级。
__declspec( align() )的一个特点是，它仅仅规定了数据对齐的位置，而没有规定数据实际占用的内存长度，当指定的数据被放置在确定的位置之后，其后的数据填充仍然是按照#pragma pack规定的方式填充的，这时候类/结构的实际大小和内存格局的规则是这样的：
在__declspec( align() )之前，数据按照#pragma pack规定的方式填充，如前所述。当遇到__declspec( align() )的时候，首先寻找距离当前偏移向后最近的对齐点（满足对齐长度为max(数据自身长度,指定值) )，然后把被指定的数据类型从这个点开始填充，其后的数据类型从它的后面开始，仍然按照#pragma pack填充，直到遇到下一个__declspec( align() )。
当所有数据填充完毕，把结构的整体对齐数值和__declspec( align() )规定的值做比较，取其中较大的作为整个结构的对齐长度。
特别的，当__declspec( align() )指定的数值比对应类型长度小的时候，这个指定不起作用。