C语言是许多刚入行编程开发的朋友的第一门语言,C语言由于出现年代较早,语法结构较为简洁(或简陋),没有太多复杂的概念。指针作为C语言为数不多的重要概念,本身的语法逻辑是非常简单清晰的,简单到一两句话就讲完了。指针的难点根本不在其语法本身,而在于对系统内存的管理。而由于指针是操作系统内存的重要途径,因此很多人以讹传讹,变成了指针有多难,这些观点对于C语言初学者来说,是有误导作用的。本文意图澄清这个误解。
先来回顾一下我们对一个变量的定义,任何变量的定义,都无非是向系统申请一块适当大小的内存,来存放对应的数据,比如
int a = 100;
char c = ‘x’;
double f = 1.2;
对编程开发初学者而言,充分理解以上变量a、b、f均为内存块非常重要。它们是大小各异、功能各异的内存块,既然是内存块,当然有各自的内存入口地址,即内存基地址。看下图:
上图中的0x0088FA04是内存块a的入口地址,0xBFF806C0是内存块c的入口地址,0xA0FF4002是内存块f的入口地址。
每一块内存的类型不同功能各异,大家各司其职:a专门存放整数,c专门存放字符,f专门存放浮点数据,每一个变量都有各自的所谓基地址。那么,我们可不可以定义一种变量,来专门存放地址呢?答案是肯定的,而这种“专门存放地址”的变量,就是所谓的指针,代码如下:
int a = 100;
char c = ‘x’;
double f = 1.2;
int *p = &a;
char *q = &c;
double *k = &f;
代码中用到了取址符&,代表获取变量的入口地址,并放入对应的指针变量中。比如获取变量a的地址 &a,放入指针变量 p 中。三个指针p、q和k分别存储了变量a、c和f的地址,他们的内存景象如下所示:
对于初学者而言,搞清楚基本概念和术语很重要,不然会很容易产生不必要的困惑。例如:指针变量、地址、指针。由于中文语言表达的特点,我们经常会混用它们,下面给与澄清:
- 指针变量。这个明白无误,就是指上述代码中的p、q和k,这些专用于存储各种不同类型数据的地址的变量。
- 地址。这个也明白无误,就是指内存入口地址。
- 指针。通常指指针变量,比如上述的p、q和k,由于指针变量是用来存储地址的,因此地址也常被称为指针。
现在回过去稍微看一眼指针变量的定义:
int *p = &a;
注意到,定义指针变量时,变量p的前面有一个星号,这个星号被称为指针定义标记,旨在告诉编译器:以后请将int型数据的地址放入p中哦,别的数据请不要放入p中。
这有什么用呢?用处是:我们拥有了另一种渠道来操作内存块a,从此我们有两种方式来操作变量a,请看:
a = 100;
*p = 100;
以上两行代码,效果是完全一致的。也就是说,*p就是a,此处的星号被称为取目标符,旨在取得指针p所指向的目标a。
我们要牢牢记住,C语言到处是一词多义,有些初学者在这个地方就开始混淆了,他们会分不清以下代码中各种星号的关系:
1 int *p1 = &a; // 定义指针变量p1,并初始化,令其指向变量a
2 *p1 = 100; // 通过指针p1取得其目标a,并将其目标a赋值为100
3
4 int *p2; // 定义指针变量p2
5 p2 = &a; // 令其指向变量a
6 *p2 = 100; // 通过指针p2取得其目标a,并将其目标a赋值为100
只要留心C语言的一词多义,马上就非常清晰了:凡是出现在定义语句的时候,星号是指针定义标记。例如上述代码的第1、4行。凡是出现在非定义语句中的时候,星号是取目标符,例如上述代码的第2、6行。
另外注意到:虽然a、c和f三个变量的大小各异,但他们的地址长度都是一样的,变量地址的长度取决于系统的寻址能力,也就是CPU的字长,在32位系统中,任何地址都是4字节的。就像一座大楼里面的房间虽然各不相同,但是房号都是3位数。