一,内存和地址
我们知道,计算机内存的每个字节都有一个唯一的地址,CPU每次寻址就是通过固定的步长(这就解释了为什么需要内存对齐)来跳跃进行寻址的。举个例子,我们可以把内存看做是一条长街上的一排房屋,每个房屋都有自己固定的门牌号,每座房屋里面都可以容纳数据,为了读取到某个房屋里面的数据,我们必须知道这个房屋的门牌号,根据这个门牌号来打开这个房间,取走数据。同样,计算机也必须为每个内存字节都编上号码,就像门牌号一样,每个字节的编号是唯一的,根据编号可以准确地找到某个字节。
二,指针的本质就是地址
当我们在程序中声明一个变量并给这个变量赋值的时候,编译器做了什么呢?实际上,变量名代表内存中的一个存储单元,在编译器对程序编译连接的时候由系统给变量分配一个地址:
int a = 10;
上面这行代码我们定义并初始化了这个变量a,系统会为a分配一块内存单元,a只是这块内存单元的别名,在程序中从变量中取值,实际上是通过变量名找到相应的内存单元,从其中读取数据。
假如系统为变量 a 分配的内存地址为0xFF00, 那么我们可以说这个地址就是变量 a 的门牌号。一个变量的地址称为该变量的指针。所以说,指针的本质就是地址,指针变量是一种特殊的变量,它专门保存指针(也即地址),当我们说这个地址对应的内存单元的时候,我们可以说这个指针指向这块内存单元。
例如:
int a = 10;
int* p = &a; //定义指针变量 p
*p = 20; //将指针p指向的值修改为 20
上面两行代码中,我们首先定义了一个整型变量 a ,然后又定义了一个指针变量 p 指向 a .第二行代码中,符号&代表取地址,相当于把变量a的地址赋值给了指针变量p(p指向a),*加在指针变量前面代表解引用,意思找到指针p指向的值,因此,第三行代码的意思就是讲p指向的值也就是a修改为20.总之一定要记住,符号&代表取值,符号*代表解引用:
符号 | 意义 |
---|---|
& | 取地址 |
* | 解引用 |
我们假设系统给变量 a 分配的内存首地址为2000,我们又声明了一个指针变量p,这个p也是要占用内存空间的(32位系统占用4个字节,64位系统占用8个字节,请思考为什么),只不过这个变量p保存的内容是变量a的地址,也就是2000,当我们想通过p来操纵a的话,首先要根据p保存的地址找到它指向的内容,也就是解引用*p,当*p的内容放生改变的时候,首地址为2000的内存单元存储的值也会做出改变,因此变量当*p被重新赋值为20的时候,变量a的值也会做出改变,变为20.
由此扩展到二级指针,如果我们再定义一个指针变量q来指向p,那么q就是一个二级指针,因为它指向的对象还是一个指针,只不过比他自己低一级,是一级指针,那么二级指针如何定义呢,请看下面的代码:
int a = 10;
int* p = &a;
int** q = &p;
上面第三行代码就是定义了一个二级指针q,它指向的是一级指针p,而一级指针p又指向了变量a。
二级指针q保存的内容为一级指针p的地址而非内容,注意p地址是2008,p的内容为2000. 因此对q进行解引用也即*q得出的是p,也就是2008,再对(*q)进行解引用也即*(*q)得出的才是变量a的值,由于运算符的结合性自右向左,因此括号可以省略,也即**q才是a的值。我们可以编写代码试一下:
cout <<"a的值为:"<< **q << endl;
我们观察一下输出结果:
a的值为:10
没错,输出的结果完全正确。
由此再扩充到多级指针,二级指针是指向一级指针的指针,那么n级指针便是指向n-1级指针的指针,以此类推。