classic C-style trick-对可变大小的数组进行内存分配
问题描述:对可变大小的数组进行内存分配,如下
typedef struct tagAStruct{
...
} AStruct;
typedef struct tagBStruct{
int d;
AStruct aStruct[N];//N为结构体数组长度,值不确定`
} BStruct;
解决方案1:指针模拟一维数组
typedef struct tagBStruct{
int d;
AStruct* aStruct;
} BStruct;
BStruct *bStruct = malloc(sizeof(BStruct) + N*sizeof(AStruct));
该代码仅仅对bStruct进行了动态内存分配,而指针aStruct指向的内存是随机的,需要对aStruct进行二次动态内存分配。
demo代码及运行结果:
#include <stdio.h>
#include <stdlib.h>
int main(int argc, char *argv[]) {
typedef struct tagAStruct{
int a;
char b;
float c;
float f;
} AStruct;
printf("the size of AStruct is %d\n",sizeof(AStruct));
typedef struct tagBStruct{
char d;
// AStruct aStruct[N];
AStruct *aStruct;
// AStruct aStruct[];
} BStruct;
printf("the size of BStruct is %d\n",sizeof(BStruct));
BStruct *bStruct = NULL;
bStruct = malloc(sizeof(BStruct) + 10 * sizeof(AStruct));
printf("the address of bStruct is %x\n",bStruct);
printf("the address of d is %x\n",&(bStruct->d));
printf("the address of aStruct is %x\n",&(bStruct->aStruct)) ;
printf("the value of aStruct is %x\n",bStruct->aStruct) ;
return 0;
}
运行结果:
如运行结果所示,指针aStruct所指内存已经不在申请内存范围内,变成野指针。
备注:sizeof(BStruct) 为16Byte,原因有二:
- 运行环境为64位机器,指针长度固定为8Byte,所以sizeof(AStruct*)为8Byte。
- 此处存在结构体字节对齐问题,即以结构体成员中占内存最多的数据类型所占的字节数为标准,所有的成员在分配内存时都要与这个长度对齐,所以结构体BStruct中的(char类型)d由本应占的1Byte变成8Byte。
解决方案2:定义空数组
为了避免上述问题,我们可以将该数组定义为AStruct aStruct[],此时数组名aStruct为指针常量,数组aStruct被连续的分配在这段申请的动态内存上,避免了二次内存分配的问题。
typedef struct tagBStruct{
int d;
AStruct aStruct[];
} BStruct;
BStruct *bStruct = malloc(sizeof(BStruct) + N*sizeof(AStruct));
demo代码及运行结果:
#include <stdio.h>
#include <stdlib.h>
int main(int argc, char *argv[]) {
typedef struct tagAStruct{
int a;
char b;
float c;
float f;
} AStruct;
printf("the size of AStruct is %d\n",sizeof(AStruct));
typedef struct tagBStruct{
char d;
// AStruct aStruct[N];
// AStruct *aStruct;
AStruct aStruct[];
} BStruct;
printf("the size of BStruct is %d\n",sizeof(BStruct));
BStruct *bStruct = NULL;
bStruct = malloc(sizeof(BStruct) + 10 * sizeof(AStruct));
printf("the address of bStruct is %x\n",bStruct);
printf("the address of d is %x\n",&(bStruct->d));
printf("the address of aStruct is %x\n",&(bStruct->aStruct)) ;
printf("the value of aStruct is %x\n",bStruct->aStruct) ;
return 0;
}
运行结果:
如运行结果所示,此时aStruct所指向的数组空间连续的分配在申请的内存块上
备注:sizeof(BStruct)为4Byte,即sizeof(int),空数组aStruct所占空间为0。
结论:
对可变大小的数组进行内存分配,建议以空数组形式定义,这样既可以避免二次内存申请,简化代码逻辑。
这个问题本质上就是int* a与int a[]的区别,int* a为指针变量,int a[]为指针常量,两者的共同特点是都用来指代一个地址,作为形参没有区别。但int* a不是固定的,可能为空或者野指针,比如上述例子中的aStruct。而int a[]传递的是固定连续的数组或者内存块,a为常量,代表数组首元素的地址(&a[0]相同)。