柔性数组

最新推荐文章于 2024-04-09 12:31:31 发布

早起的虫儿有鹰吃

最新推荐文章于 2024-04-09 12:31:31 发布

阅读量323

点赞数 1

分类专栏： c/c++ 文章标签： c语言柔性数组变体结构体

c/c++ 专栏收录该内容

10 篇文章 1 订阅

订阅专栏

一般来说，结构中最后一个元素允许是未知大小的数组，这个数组就是柔性数组。但结构中的柔性数组前面必须至少一个其他成员,柔性数组成员允许结构中包含一个大小可变的数组，sizeof返回的这种结构大小不包括柔性数组的内存。包含柔数组成员的结构用malloc函数进行内存的动态分配,且分配的内存应该大于结构的大小以适应柔性数组的预期大小。柔性数组到底如何使用？

不完整类型

C和C++对于不完整类型的定义是一样的，不完整类型是这样一种类型，它缺乏足够的信息例如长度去描述一个完整的对象。

不完整类型举例：
前向声明就是一种常用的不完整类型

1	`struct` `test;` `//test 只给出了声明，没有给出定义`

不完整数据类型必须通过某种方式补充完整，才能使它们进行实例化。否则只能用于定义指针或引用，因为此时实例化的是指针或引用本身，不是base和test对象

一个未知长度的数组也属于不完整类型：

1	`extern` `int` `a[];`

extern 关键字不能去掉，因为数组的长度未知，不能作为定义出现。不完整类型的数组需要补充完整才能使用。不完整类型的数组可以通过几种方式补充完整，大括号形式的初始化就是其中的一种方式：

1	`int` `a[] = { 10,20 };`

结构体

首先，我们需要知道——所谓变量，其实是内存地址的一个抽像名字罢了。在静态编译的程序中，所有的变量名都会在编译时被转成内存地址。机器是不知道我们取的名字的，只知道地址。

所以有了——栈内存区，堆内存区，静态内存区，常量内存区，我们代码中的所有变量都会被编译器预先放到这些内存区中。

有了上面这个基础，我们来看一下结构体中的成员的地址是什么？我们先简单化一下代码：

1

2

3

4

上面代码中，test结构中i和p指针，在C的编译器中保存的是相对地址——也就是说，他们的地址是相对于struct test的实例的。如果我们有这样的代码：

1	`struct` `test t;`

下面做个实验：

 
         #include<stdio.h> 
        
         struct 
          test{ 
        
         int 
          i; 
        
         char 
          *p; 
        
         }; 
        
         int 
          main( 
         void 
         ) 
        
         { 
        
         struct 
          test t; 
        
         printf 
         ( 
         "%p\n" 
         , &t); 
        
         printf 
         ( 
         "%p\n" 
         , &(t.i)); 
        
         printf 
         ( 
         "%p\n" 
         , &(t.p)); 
        
         return 
          0; 
        
         }

运行结果:

我们可以看到，t.i的地址和t的地址是一样的，t.p的址址相对于t的地址多了个8。说白了，t.i 其实就是(&t + 0×0), t.p 的其实就是 (&t + 0×8)。0×0和0×8这个偏移地址就是成员i和p在编译时就被编译器给hard code了的地址。于是，你就知道，不管结构体的实例是什么——访问其成员其实就是加成员的偏移量。

下面再来做个实验：

 
         #include<stdio.h> 
        
         struct 
          test{ 
        
         int 
          i; 
        
         short 
          c; 
        
         char 
          *p; 
        
         }; 
        
         int 
          main( 
         void 
         ) 
        
         { 
        
         struct 
          test *pt=NULL; 
        
         printf 
         ( 
         "%p\n" 
         , &(pt->i)); 
        
         printf 
         ( 
         "%p\n" 
         , &(pt->c)); 
        
         printf 
         ( 
         "%p\n" 
         , &(pt->p)); 
        
         return 
          0; 
        
         }

运行结果:

注意：上面的pt->p的偏移之所以是0×8而不是0×6，是因为内存对齐了（我在64位系统上）。关于内存对齐，具体可以参看本站C语言内存对齐实例详解一文。

柔性数组

柔性数组成员（flexible array member）也叫伸缩性数组成员，这种代码结构产生于对动态结构体的需求。在日常的编程中，有时候需要在结构体中存放一个长度动态的字符串，一般的做法，是在结构体中定义一个指针成员，这个指针成员指向该字符串所在的动态内存空间，例如：

1

2

3

4

5

6

p指向字符串，这种方法造成字符串与结构体是分离的，不利于操作。把字符串和结构体连在一起的话，效果会更好，可以修改如下：

1

2

3

 
         char 
          a[] =  
         "Hello world" 
         ; 
        
 
         struct 
          s_test *ptest = ( 
         struct 
          s_test*) 
         malloc 
         ( 
         sizeof 
         (s_test)+streln(a)+1); 
        
 
         strcpy 
         (ptest+1,a); 
        

这样一来，(char*)(ptestt + 1)就是字符串“hello world”的地址。这时候p成了多余的东西，可以去掉。但是，又产生了另外一个问题：老是使用(char*)(ptestt + 1)不方便。如果能够找出一种方法，既能直接引用该字符串，又不占用结构体的空间，就完美了，符合这种条件的代码结构应该是一个非对象的符号地址，在结构体的尾部放置一个0长度的数组是一个绝妙的解决方案。不过，C/C++标准规定不能定义长度为0的数组，因此，有些编译器就把0长度的数组成员作为自己的非标准扩展，例如：

1

2

3

4

5

6

c就叫柔性数组成员，如果把ptest指向的动态分配内存看作一个整体，c就是一个长度可以动态变化的结构体成员，柔性一词来源于此。c的长度为0，因此它不占用test的空间，同时ptest->c就是“hello world”的首地址，不需要再使用(char*)(ptestt + 1)这么丑陋的语法了。

鉴于这种代码结构所产生的重要作用，C99甚至把它收入了标准中：

As a special case, the last element of a structure with more than one named member may have an incomplete array type; this is called a flexible array member.
C99使用不完整类型实现柔性数组成员，标准形式是这样的：

1

2

3

4

5

6

c同样不占用test的空间，只作为一个符号地址存在，而且必须是结构体的最后一个成员。柔性数组成员不仅可以用于字符数组，还可以是元素为其它类型的数组，例如：

1

2

3

4

5

6

首先，我们要知道，0长度的数组在ISO C和C++的规格说明书中是不允许的。这也就是为什么在VC++2012下编译你会得到一个警告：“arning C4200: 使用了非标准扩展 : 结构/联合中的零大小数组”。

那么为什么gcc可以通过而连一个警告都没有？那是因为gcc 为了预先支持C99的这种玩法，所以，让“零长度数组”这种玩法合法了。关于GCC对于这个事的文档在这里：“Arrays of Length Zero”，文档中给了一个例子，完整代码如下：

 
         #include <stdlib.h> 
        
         #include <string.h> 
        
         struct 
          line { 
        
         int 
          length; 
        
         char 
          contents[0];  
         // C99的玩法是：char contents[]; 没有指定数组长度 
        
         }; 
        
         int 
          main(){ 
        
         int 
          this_length=10; 
        
         struct 
          line *thisline = ( 
         struct 
          line *) 
        
         malloc 
          ( 
         sizeof 
          ( 
         struct 
          line) + this_length); 
        
         thisline->length = this_length; 
        
         memset 
         (thisline->contents,  
         'a' 
         , this_length); 
        
         return 
          0; 
        
         }

上面这段代码的意思是：我想分配一个不定长的数组，于是我有一个结构体，其中有两个成员，一个是length，代表数组的长度，一个是contents，代码数组的内容。后面代码里的 this_length（长度是10）代表是想分配的数据的长度。

柔性数组的引用（缓冲区）

对于编译器而言，数组名仅仅是一个符号，它不会占用任何空间，它在结构体中，只是代表了一个偏移量，代表一个不可修改的地址常量！

对于0长数组的这个特点，很容易构造出变成结构体，如缓冲区，数据包等等：

Struct Buffer

{

Int len;

Char cData[0];

};

这样的变长数组常用于网络通信中构造不定长数据包，不会浪费空间浪费网络流量，比如我要发送1024字节的数据，如果用定长包，假设定长包的长度为2048，就会浪费1024个字节的空间，也会造成不必要的流量浪费

Struct packet

{

char data[2048];

}

packet p;

memcpy(p.data,"1024 datas.........",1024)

send(socket,(char*)&p,sizeof(p));

由于考虑到数据的溢出，变长数据包中的data数组长度一般会设置得足够长足以容纳最大的数据，因此packet中的data数组很多情况下都没有填满数据，因此造成了浪费，而如果我们用变长数组来进行封包的话，就不会造成浪费（最多会造成4个字节的浪费，包头的int型的len不属于数据因此算是浪费），如前面的Buffer结构体，假如我们要发送1024个字节，我们如何构造这个数据包呢：

char *tmp = (char*)malloc(sizeof(Buffer)+1024) //这句代码的作用是申请一块连续的内存空间，这块内存空间的长度是Buffer的大小加上1024数据的大小，由两部分构成，sizeof(Buffer)和1024,如果仔细观察的话，会发现这种申请方法比第一种多了一段sizeof(Buffer)大小的空间，原因何在？如下

Buffer *p = (Buffer*)tmp;

p->len = 1024;

memcpy(p.cData,"1024 datas............",1024);

如上三行代码，首先做一个强制类型转换，Buffer类型的指针指向内存的起始位置，这段内存要分两部分使用，前部分4个字节p->len，作为包头(就是多出来的那部分)，这个包头是用来描述紧接着包头后面的数据部分的长度，这里是1024，所以前四个字节赋值为1024(既然我们要构造不定长数据包，那么这个包到底有多长呢，因此，我们就必须通过一个变量来表明这个数据包的长度，这就是len的作用)，而紧接其后的内存是真正的数据部分，通过p->cData定位到该部分的起始地址，最后，进行一个memcpy()内存拷贝，把要发送的数据填入到这段内存当中，最后：

send(socket,p,sizeof(Buffer)+1024);发送数据

早起的虫儿有鹰吃

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
柔性数组

一般来说，结构中最后一个元素允许是未知大小的数组，这个数组就是柔性数组。但结构中的柔性数组前面必须至少一个其他成员,柔性数组成员允许结构中包含一个大小可变的数组，sizeof返回的这种结构大小不包括柔性数组的内存。包含柔数组成员的结构用malloc函数进行内存的动态分配,且分配的内存应该大于结构的大小以适应柔性数组的预期大小。柔性数组到底如何使用？不完整类型C和C++对于不完整类型
复制链接

扫一扫