前言
新了解char[0]的少年们很愉悦的将其应用到了项目中,多看一条注意事项可以减少不必要的痛苦。
引言
在C语言中char[0]是一种数组的特殊用法,用于标记一个指针在一个结构体最后:
例如:
struct node
{
int number;//后面的数据长度
char data[0];//这是一个指针,不占空间
}
sizeof(node)就等于sizeof(int);
更多的资料看这里:
结构体中的指针与零长度数组
注意事项
今天我要讲的是另一个相关注意点:对齐对零字节数组的影响
struct node
{
int xxx; //4字节
char yyy; //1字节
char data[0]; //零字节数组
}
零字节数组是不占struct空间的,它针向所有结构体内容之后,但是这个之后是哪里呢?答案是紧挨着char yyy
后面。
一般情况下char yyy
就是struct的最后一项,但是当结构体没有被明确要求对齐的时候会出现填充的情况,即编译器为了对齐结构体往里面填无效的内容。
此时如下:
struct node
{
int xxx;//4字节
char yyy;//1字节
char 填充;//char data[0];//零字节数组
char 填充;
char 填充;
}
很遗憾现在data[0]指向的是填充部位。而我们期望的是它要指向node
之后。
这样会造成如下错误:
通过sizeof()
node* p = new char[sizeof(node)+3];//申请三个字节紧跟着node结构体
memset((char*)p,0,sizeof(node)+3);//在结构体里填零,方便对比
p->xxx =1;
p->yyy =2;
p->data[0]=1;
p->data[1]=2;
p->data[2]=3;
不好意思,你的空间是申请到了,但你赋值都赋到了对齐的废字节上了,内存结构:
1//xxx
2//yyy
1//实际的data[0]
2//实际的data[1]
3//实际的data[2]
0//你以为的data[0]
0//你以为的data[1]
0//你以为的data[2]
在实际工作中你会发现你的数据结构后面始终有几个字节是0,而你通过sizeof(结构体)
的偏移去读你的char[0]
会因为偏移错误而读到错误的数据。
而这件事情发生与否取决于你的结构体是否变动:幽灵BUG。
解决之道
非常简单:对有零字节数组参与的结构体进行1字节对齐:
#pragma pack(1)
struct node
{
int xxx;//4字节
char yyy;//1字节
char data[0];//零字节数组
}
#pragma pack()
再执行上面的操作:
node* p = new char[sizeof(node)+3];//申请三个字节紧跟着node结构体
memset((char*)p,0,sizeof(node)+3);//在结构体里填零,方便对比
p->xxx =1;
p->yyy =2;
p->data[0]=1;
p->data[1]=2;
p->data[2]=3;
内存结果:
1//xxx
2//yyy
1//实际的data[0]=你认为的data[0]
2//实际的data[1]=你认为的data[1]
3//实际的data[2]=你认为的data[2]
祝编程进步。