每当提到c++中的引用时,我们的脑海中浮现的第一句话可能就是--引用就是一个变量的别名,但是引用的的类型到底是什么?它和指针有什么关系?它本身在内存中占用空间么?我们的编译器是如何将它实现的呢?带着这些疑问,我们今天就从汇编的角度来解析c++中的引用到底是什么东西?
1.首先让我们来看看指针和引用的定义和性质区别:
(1)指针:指针是一个变量,只不过这个变量存储的是一个地址,指向内存的一个存储单元;而引用跟原来的变量实质上是同一个东西,只不过是原变量的一个别名而已。如:
int a=1;int *p=&a;
int a=1;int &b=a;
上面定义了一个整形变量和一个指针变量p,该指针变量指向a的存储单元,即p的值是a存储单元的地址。
而下面2句定义了一个整形变量a和这个整形a的引用b,事实上a和b是同一个东西,在内存占有同一个存储单元。
(2)可以有const指针,但是没有const引用;
(3)指针可以有多级,但是引用只能是一级(int **p;合法 而 int &&a是不合法的)
(4)指针的值可以为空,但是引用的值不能为NULL,并且引用在定义的时候必须初始化;
(5)指针的值在初始化后可以改变,即指向其它的存储单元,而引用在进行初始化后就不会再改变了,正所谓引用的从一而终。
(6)"sizeof引用"得到的是所指向的变量(对象)的大小,而"sizeof指针"得到的是指针本身的大小;
(7)指针和引用的自增(++)运算意义不一样;
2.从汇编的角度来看引用的实现,首先我们开看看如下代码:#include<stdio.h>
int main(){
int a=1;
int &b=a;
printf("the value of c is: %d\n",b);
}
这是一个很简单的程序,让我们来看看g++(系统为ubuntu 16.04)下的几行关键的汇编代码:
movl $0x1,-0x14(%ebp)
ebp寄存器存放的是栈底的地址,这条指令的意思是将1的值存放到距离栈底24字节的位置,-0x18(%ebp)表示变量a的地址
lea -0x14(%ebp),%eax
将a的地址存放到寄存器eax中
mov %eax,-0x10(%ebp)
将寄存器eax的值存放到变量a的地址的上面(栈的扩展方向为从高低至到底地址)
mov -0x14(%ebp),%eax
因为a是函数printf的参数,所以将a的值放到寄存器eax中
sub $0x8,%esp
调整栈顶指针
push %eax
将变量a入栈
push $0x8048550
这里的0x8048550是.rodata段中the value of c is: %d\n字符串常量的地址,将这个字符串常量的地址入栈
call 8048330 <printf@plt>
调用函数printf,这里使用的是动态链接中延迟绑定的方法,详细内容请看《程序员的自我修养》动态链接一章
我们将代码修改如下:
#include<stdio.h>
int main(){
int a=1;
int &b=a;
printf("the value of c is: %d\n",a);
printf("the value of c is: %d\n",*(&a-1));
}
程序输出如下
可见,在汇编的角度来看,引用的实现要借助指针,但具体的实现方法是编译器的事,我们不必细究.