http://blog.csdn.net/npy_lp/article/details/7009120
前言:计算机语言是编译器和程序员交流的依据和规范,GNU C是GCC特有的功能,在Linux内核中被广泛应用。
帮助文档:http://gcc.gnu.org/onlinedocs/gcc-4.6.2/gcc/C-Extensions.html#C-Extensions
1、零长数组
GNU C允许声明长度为零的数组,但它只能被用于结构体的最后一个成员。
举例,如清单1:
- #include <stdio.h>
- #include <stdlib.h>
- struct line {
- int length;
- char contents[0];
- };
- int main(void)
- {
- int i, count = 9;
- char letter = 'A';
- struct line *thisline = (struct line *)malloc(sizeof(struct line) + count);
- thisline->length = count;
- for (i = 0; i < count; i++)
- thisline->contents[i] = letter++;
- printf("sizeof(struct line) = %d\n", sizeof(struct line));
- for (i = 0; i < thisline->length; i++)
- printf("%c ", thisline->contents[i]);
- printf("\n");
- return 0;
- }
例子输出结果:
- sizeof(struct line) = 4
- A B C D E F G H I
如例子中的第6行,contents就是一个零长数组,在sizeof看来它所占的空间为零。
在ISO C99中,使用变长数组也可以实现同样的功能,如清单2:
- #include <stdio.h>
- #include <stdlib.h>
- struct line {
- int length;
- char contents[];
- };
- struct line thisline = { 5, {'1', '2', '3', '4', '5' } };
- int main(void)
- {
- int i;
- printf("sizeof(struct line) = %d\n", sizeof(struct line));
- printf("sizeof(thisline) = %d\n", sizeof(thisline));
- for (i = 0; i < thisline.length; i++)
- printf("%c ", thisline.contents[i]);
- printf("\n");
- return 0;
- }
例子输出结果:
- sizeof(struct line) = 4
- sizeof(thisline) = 4
- 1 2 3 4 5
变长数组是不完全数据类型,不能使用sizeof获得它的大小。
注意,此结构体的变量必须在函数外定义和初始化,否则会报错:
- error: non-static initialization of a flexible array member
- error: (near initialization for 'thisline')
不能使用这样的形式:
- struct mystruct {
- int arr[];
- };
否则会报错:
- error: flexible array member in otherwise empty struct
2、变长数组
在支持变长数组之前,C语言数组的大小是在声明时确定的(下标是一个常量表达式)并一直保持不变。所谓变长数组就是指数组的大小可以在运行时指定,如清单3:
- #include <stdio.h>
- int main(void)
- {
- int i;
- scanf("%d", &i);
- int arr[i];
- printf("sizeof(arr[%d]) = %d\n", i, sizeof(arr));
- return 0;
- }
例子输出结果:
- sizeof(arr[6]) = 24 //输入数字6
- sizeof(arr[9]) = 36 //输入数字9
输入不同的值,数组的大小随之改变。
变长数组作为参数进行传递的例子,如清单4:
- #include <stdio.h>
- int sum(int num, int arr[num])
- {
- int i, total = 0;
- for (i = 0; i < num; i++)
- total += arr[i];
- return total;
- }
- int main(void)
- {
- int a[] = {1, 2, 3, 4};
- int b[] = {5, 6, 7, 8, 9, 10};
- printf("a[] total value: %d\n", sum(sizeof(a)/sizeof(a[0]), a));
- printf("b[] total value: %d\n", sum(sizeof(b)/sizeof(b[0]), b));
- return 0;
- }
例子输出结果:
- a[] total value: 10
- b[] total value: 45
函数sum形参中的arr可以匹配任意的一维整型数组。
注意,num一定要声明在变长数组arr之前。
-----------------------------------------------------------------------------------------------------------------------------
在一些 C 语言编写的代码中,有时可以看到如下定义的结构:
{
char * name;
int length;
char bytes[0];
} user_def_t ;
这个 bytes 是什么意思?我们知道 0 == sizeof(bytes),那么 bytes 仅仅是为了定义结构的尾地址吗?
不是的。这里的 bytes 是作为扩展数组用的。请看如下代码:
{
p = (user_def_t)malloc(sizeof(user_def_t) + length);
if (NULL == p)
{
return -1 ;
}
p->name = NULL;
p->length = length;
memset(p->bytes, 0 , length);
return 0 ;
}
是不是很酷?同样,也可以把 name 域的值附在结构后面:
{
p = (user_def_t)malloc(sizeof(user_def_t) + strlen(name) + length + 1);
if (NULL == p)
{
return -1;
}
memcpy(p->name, name, strlen(name) + 1); /* 别忘了'/0' */
p->length = length;
memset(p->bytes, 0, length);
return 0;
}
总结:在某一结构末尾如定义类似 char bytes[0] 的零长数组,表示该结构不定长,可通过数组的方式进行扩展。结构中必包含一个长度信息。结构本身类似于一个信息头。同时,此结构只能通过堆方式分配内存。
========================
1.零长度数组不是所有的c标准都支持,gnu c支持,ansi c不支持,c++不支持。
2.可以把结构体中定义了零长度数组的地方 视为结构体的结尾,在它之后最好不要再定义任何字段。因为零长度数组用来动态的添加数据,一旦添加数据后,零长度数组字段之后定义的字段如果之前赋了值,那么这个值就会被改掉。(结构体的里面的数据在内存中按顺序存储的。)
3.如何扩展:
可以直接使用数组方式添加信息:
p->bytes[0] = 'a';
p->bytes[1] = 'b';
也可以通过memcpy,strcpy等函数拷贝方式来添加。
4.等价写法:
typedef struct user_def{
char* name;
int length;
char bytes[];
}user_def_t;
把char bytes[0] 写成 char bytes[]也可以,但是这样写的话在slickedit里面调试时,查看结构体的成员时是看不到bytes[]这个成员的,写成bytes[0]的话就可以。
在标准 C 和 C++ 中,不允许用 0 长度数组,但在 GNU C 中,却可以定义 0 长度数组。比如:
引用struct line {
int length ;
char contents [ 0 ];
}
0 长度数组不占有空间,从打印 sizeof (struct line) 可以看到这个结构体的长度为 4,这 4 字节空间属于整型量 length 。那么结构体里最后的 0 长度字符数组 contents[0] 用来做什么呢?答案是,它可以用来指向一段由你自己分配的 buffer 空间。如:
引用int this_length = 60 ;
struct line * thisline = ( struct line * ) malloc ( sizeof ( struct line ) + this_length );
thisline->length = this_length;
这样,就开辟了 64 字节空间。前面 4 个字节为 this_length 用,后面 60 个字节被 contents 数组用。经过空间分配后,就相当于把结构体定义为:
引用struct line {
int length ;
char contents [ 60 ];
}
顺便看一下这个空间的分布,做如下打印:
引用printf ( "thisline 指向的地址为 %p /n " , thisline );
printf ( "thisline指向的第一个元素值为:%d /n " , thisline -> length );
printf ( "该元素的地址为%p /n " , & thisline -> length );
printf ( "%p /n " , & thisline -> contents );
printf ( "%p /n " , & thisline -> contents [ 0 ]);
printf ( "%p /n " , & thisline -> contents [ 1 ]);
输出为:
引用thisline 指向的地址为 0x8780008
thisline指向的第一个元素值为:60
该元素的地址为0x8780008
0x878000c
0x878000c
0x878000d
从输出可以看到,thisline-contents 只是一个“不占有空间“(其特性由编译器决定)的常量指针。在这里,它表示接着整型值后的起始地址。
现在,我们可以使用这个数组了,比如给这个数组的前几个元素赋下值:
引用char c = 'x' ;
int i ;
thisline -> contents [ 0 ] = c ;
c = 'y' ;
thisline -> contents [ 1 ] = c ;
c = 'z' ;
thisline -> contents [ 2 ] = c ;
for ( i = 0 ; i < 3 ; i ++ )
printf ( "%c /n " , thisline -> contents [ i ]);
还有一个问题需要探讨。既然用了 malloc() 函数,那么在最后就会使用 free() 函数来释放掉所申请的内存空间。那么,在这里,是不是只是用 free(thisline) 就能达到目的了呢?下面做一个实验:
首先在程序中,将分配缓冲区的首地址备份起来:
引用struct line * thisline_bak = thisline ;
现在做如下释放然后看一下空间中首元素(length)的值:
引用free(thisline);
printf ( "%d /n " , thisline_bak -> length );
一般在打印里可以看到 length 的输出值为 0 ,这也说明,首个元素的内存空间确实被释放了。在这里,严格的说,这个指针已经不能再这么用,因为它指向了一个被释放的内存空间。
但是,如果我们再次运行
引用for ( i = 0 ; i < 3 ; i ++ )
printf ( "%c /n " , thisline -> contents [ i ]);
这 个打印,发现仍然能够正常的打印出值来,从而说明了,后面申请的数组缓冲区还没释放。原因是,由于分配的空间返回的指针被强制转换为 struct line 类型,且所得到的空间并不是平缓的(包含的不是同一种元素类型的空间)。在这里的空间组成是,一个整型值 + 后面一大块字符型缓冲区。所以,在释放时,free() 函数认为 *thisline 只是一个指向 4 字节整型值的空间。因而,我们要完全释放整个申请的空间,还需要:
引用free (thisline->contents);
此后,如果再次打印之前那 3 个赋值的元素时,会发现段错误,或者是类似下面的错误:
引用*** glibc detected *** ./array4: free(): invalid pointer: 0x09e4300c ***
======= Backtrace: =========
/lib/tls/i686/cmov/libc.so.6(+0x6b591)[0x5b8591]
/lib/tls/i686/cmov/libc.so.6(+0x6cde8)[0x5b9de8]
/lib/tls/i686/cmov/libc.so.6(cfree+0x6d)[0x5bcecd]
./array4[0x80485ad]
/lib/tls/i686/cmov/libc.so.6(__libc_start_main+0xe6)[0x563bd6]
./array4[0x80483c1]
======= Memory map: ========
... ...
所以,在不用这段空间时,可如下释放:
free (thisline->contents); /*先释放掉后面的数组buffer*/
free(thisline); /*再释放掉 4 字节整型空间*/