指针可以指向空,但引用不能指向空,必须指向某些对象,引用必须被初始化.
指针可以被重新赋值以指向另一个不同的对象。但是引用则总是指向在初始化时被指定的对象,以后不能改变.
指针的本质是一个与地址相关的复合类型,它的值是数据存放的位置(地址);数组的本质则是一系列的变量。
数组名对应着(而不是指向)一块内存,其地址与容量在生命期内保持不变,只有数组的内容可以改变。指针可以随时指向任意类型的内存块,它的特征是“可变”,所以我们常用指针来操作动态内存。
当数组作为函数的参数进行传递时,该数组自动退化为同类型的指针。
数组与指针是两个不同的概念,即使是从编译的层面上来看。不过,在很多时候,两者的用法极为相似。本文将讨论两者的区别。
一、理论分析
编译器在处理指针与数组的时候,是区别对待的。
对于指针
p 是一个变量,所以编译器要为之分配一个空间。
对于数组:
a 是一个地址,编译器会为数组 a 分配一个空间,但不会为 a 本身分配空间,在使用到a的地方,会被替换为一个地址+属性,其结果为一个"常量指针"。
在对一个指针变量进行 dereferance 的时候,比如 (*p)。编译器首先要得到 p 的地址,从中取值,然后把得到的值作为地址,再取值。类似如下汇编:
相比之下,数组的引用
则省去了取 a 地址的过程,符号 a 代表一个地址,这个地址不存放在任何变量中!
熟悉汇编的人,容易从看出,区别是大的。
二、两个例子
第一个例子,演示 "把数组声明为指针" 是如何使程序崩溃的。
运行这个程序,Segmentation fault
在模块1.c 中, a 被定义为一个数组,但在模块 2.c中,a被声明为指针。所以编译器在处理 printf ("%d/n", a[0]) 时:
认为 a 是一个指针,所以先取其地址&a,然而,a 实际是个数组,&a 就是 a本身,所的 &a 是 a 的首地址。
然后编译器取 指针a的值,这实际上是 得到的是数组的第一个元素 a[0] ,值为0!也就是,编译器得到了一个 0 指针,最后,编译器对其derefrence,崩溃!
第二个例子演示“把指针声明为数组”如何的到错误的数据:
在这个例子中, pa 被定义为一个指针,并初始化为0, 但在另一个模块中,被声明为一个数组.
编译器在处理 printf ("%p/n", pa) 时,认为 pa 是数组,所以直接打印符号pa的值,此值为指针pa的地址!
编译器在处理 printf ("%p/n", pa[0]) 时,认为 pa 是数组,以符号 pa 对应的值加一个偏移0,并取其值,得到的实际上是 指针 pa 的值 即 0.
指针可以被重新赋值以指向另一个不同的对象。但是引用则总是指向在初始化时被指定的对象,以后不能改变.
指针的本质是一个与地址相关的复合类型,它的值是数据存放的位置(地址);数组的本质则是一系列的变量。
数组名对应着(而不是指向)一块内存,其地址与容量在生命期内保持不变,只有数组的内容可以改变。指针可以随时指向任意类型的内存块,它的特征是“可变”,所以我们常用指针来操作动态内存。
当数组作为函数的参数进行传递时,该数组自动退化为同类型的指针。
数组与指针是两个不同的概念,即使是从编译的层面上来看。不过,在很多时候,两者的用法极为相似。本文将讨论两者的区别。
一、理论分析
编译器在处理指针与数组的时候,是区别对待的。
对于指针
CODE:
int *p;
p 是一个变量,所以编译器要为之分配一个空间。
CODE:
.comm p, 4
对于数组:
CODE:
int a[10]
a 是一个地址,编译器会为数组 a 分配一个空间,但不会为 a 本身分配空间,在使用到a的地方,会被替换为一个地址+属性,其结果为一个"常量指针"。
CODE:
.comm a, 40
在对一个指针变量进行 dereferance 的时候,比如 (*p)。编译器首先要得到 p 的地址,从中取值,然后把得到的值作为地址,再取值。类似如下汇编:
CODE:
lea (p), %esi /* this is &p */
mov (%esi), %edi /* this is p */
mov (%edi), %eax /* this is p[0] */
或者,更简单的
mov (p), %esi /* this is p */
mov (%esi), %eax /* and this is p[0] */
mov (%esi), %edi /* this is p */
mov (%edi), %eax /* this is p[0] */
或者,更简单的
mov (p), %esi /* this is p */
mov (%esi), %eax /* and this is p[0] */
相比之下,数组的引用
CODE:
int a[10];
a[0];
a[0];
则省去了取 a 地址的过程,符号 a 代表一个地址,这个地址不存放在任何变量中!
CODE:
lea (a), %esi /* this is a */
mov (%esi), %eax /* this is a[0] */
或更简单的:
mov (a), %esi /* this is a[0] */
mov (%esi), %eax /* this is a[0] */
或更简单的:
mov (a), %esi /* this is a[0] */
熟悉汇编的人,容易从看出,区别是大的。
二、两个例子
第一个例子,演示 "把数组声明为指针" 是如何使程序崩溃的。
CODE:
file: 1.c
int a[10]={0};
file: 2.c
int
main ()
{
extern int *a;
printf ("%d/n", a[0]);
return 0;
}
int a[10]={0};
file: 2.c
int
main ()
{
extern int *a;
printf ("%d/n", a[0]);
return 0;
}
运行这个程序,Segmentation fault
在模块1.c 中, a 被定义为一个数组,但在模块 2.c中,a被声明为指针。所以编译器在处理 printf ("%d/n", a[0]) 时:
认为 a 是一个指针,所以先取其地址&a,然而,a 实际是个数组,&a 就是 a本身,所的 &a 是 a 的首地址。
然后编译器取 指针a的值,这实际上是 得到的是数组的第一个元素 a[0] ,值为0!也就是,编译器得到了一个 0 指针,最后,编译器对其derefrence,崩溃!
第二个例子演示“把指针声明为数组”如何的到错误的数据:
CODE:
file: 3.c
int *pa = (int *)0;
f ()
{
printf ("%x/n", &pa);
}
file: 4.c
int
main ()
{
extern int pa[];
printf ("%p/n", pa);
printf ("%d/n", pa[0]);
f ();
return 0;
}
int *pa = (int *)0;
f ()
{
printf ("%x/n", &pa);
}
file: 4.c
int
main ()
{
extern int pa[];
printf ("%p/n", pa);
printf ("%d/n", pa[0]);
f ();
return 0;
}
CODE:
0x403010
0
403010
0
403010
在这个例子中, pa 被定义为一个指针,并初始化为0, 但在另一个模块中,被声明为一个数组.
编译器在处理 printf ("%p/n", pa) 时,认为 pa 是数组,所以直接打印符号pa的值,此值为指针pa的地址!
编译器在处理 printf ("%p/n", pa[0]) 时,认为 pa 是数组,以符号 pa 对应的值加一个偏移0,并取其值,得到的实际上是 指针 pa 的值 即 0.