数组名和数组名取地址的区别

本文探讨了C语言中数组名作为指针的特性及其在不同上下文中的行为差异,包括数组名自身的行为及与取址运算符结合时的不同表现。

以下代码会打印出什么样的日志呢?

#include <stdio.h>

int a[2] = {1,2};
int main(){
        printf("a = %p\n", a); // I
        printf("&a = %p\n", &a); // II
        printf("a + 1 = %p\n", a + 1);// III
        printf("&a + 1 = %p\n", &a + 1);// IV

        return 0;
}
本机(linux)结果输出:
a = 0x804a014
&a = 0x804a014
a + 1 = 0x804a018
&a + 1 = 0x804a01c

没错,上面I 和 II打印出来的地址是一样的,IV 要比 III 大4个字节的地址空间。下面是我对这一现象的解释,如有不妥的地方请各位大虾一定给于指出:

首先引用《C和指针》p141中的理论
在C中, 在几乎所有使用数组的表达式中,数组名的值是个指针常量,也就是数组第一个元素的地址。 它的类型取决于数组元素的类型: 如果它们是int类型,那么数组名的类型就是“指向int的常量指针“。
看到这里我想应该就知道为什么 会有I 和 III式的结果了。

对于II 和 IV 则是特殊情况,在《C和指针》p142中说到,在以下两中场合下,数组名并不是用指针常量来表示,就是当数组名作为sizeof操作符和单目操作符&的操作数时。 sizeof返回整个数组的长度,而不是指向数组的指针的长度。 取一个数组名的地址所产生的是一个指向数组的指针,而不是一个指向某个指针常量的指针。
所以&a后返回的指针便是指向数组的指针,跟a(一个指向a[0]的指针)在指针的类型上是有区别的。

然后我们用符号表和汇编代码来看看编译器到底是怎样区分&a 和 a, 并将其转换为汇编代码的

通过 nm a.out 得到符号表如下:

。。。。。。。// 省略了一些与本主题无关的变量
0804a01c A _edata
0804a024 A _end
080484ec T _fini
08048508 R _fp_hw
080482bc T _init
08048330 T _start
0804a014 D a // a 变量保存在虚拟地址0x0804a014 中
0804a01c b completed.7021
0804a00c W data_start
0804a020 b dtor_idx.7023
080483c0 t frame_dummy
080483e4 T main // main函数的地址
         U printf@@GLIBC_2.0

调用gcc -S xx.c得到汇编代码:

	.file	"name_of_array.c"
.globl a
	.data
	.align 4
	.type	a, @object
	.size	a, 8 // 从这里我们便知道sizeof(a) 等于8
a:
	.long	1 // 从这里可以看出,编译器直接把 .c文件中的int 转化为long型
	.long	2
	.section	.rodata
.LC0:
	.string	"a = %p\n"
.LC1:
	.string	"&a = %p\n"
.LC2:
	.string	"a + 1 = %p\n"
.LC3:
	.string	"&a + 1 = %p\n"
	.text
.globl main
	.type	main, @function
main:
	pushl	%ebp
	movl	%esp, %ebp
	andl	$-16, %esp
	subl	$16, %esp
	movl	$.LC0, %eax // I 所对应的汇编代码
	movl	$a, 4(%esp)
	movl	%eax, (%esp)
	call	printf
	movl	$.LC1, %eax // II 所对应的汇编代码
	movl	$a, 4(%esp)
	movl	%eax, (%esp)
	call	printf
	movl	$.LC2, %eax // III 所对应的汇编代码
	movl	$a+4, 4(%esp)
	movl	%eax, (%esp)
	call	printf
	movl	$a+8, %edx // IV 所对应的汇编代码
	movl	$.LC3, %eax
	movl	%edx, 4(%esp)
	movl	%eax, (%esp)
	call	printf
	movl	$0, %eax
	leave
	ret
	.size	main, .-main
	.ident	"GCC: (Ubuntu 4.4.3-4ubuntu5) 4.4.3"
	.section	.note.GNU-stack,"",@progbits
I所对应的汇编代码 movl $a, 4(%esp)
$表示取地址,通过符号表我们知道a对应地址为0x0804a014, 所以这段代码将会打印0x0804a014。但是我们明明在代码里写的是printf("a = %p\n", a), (如果a不为数组名而是一般意义的int变量,相应的汇编码应为movl a, 4(%esp) 怎么编译后的汇编代码会是对a取地址呢? 本人猜测为编译器自动给a 加了一个取值符,从而翻译为$a。
结论: 对于用户没有明确给出&的编码,编译器翻译自动给变量a加上取值符$, 其中取a的地址得到的指针类型由数组元素决定。

II 略过

III movl $a+4, 4(%esp)
对a加上取值符得到$a,因为数组元素类型为int,所以指针每次需要移动四个字节的地址空间。 所以c代码 a + 1 翻译为汇编 $a + 4 

IV  movl $a+8, %edx 
所对应用户代码为printf("a = %p\n", &a + 1), 根据《C和指针》中的理论,当a前面有&操作符时,编译器将会把a对应符号表中的地址看作指向数组的指针,sizeof(a) 为8,
从而&a + 1 将会翻译为$a + 8
结论: 对于用户明确给出&的编码,编译器将会把取a的地址得到的指针类型看作指向数组的指针。

总结:编译器通过用户是否给出&,来决定指针变量的类型,进而翻译为相应的汇编码。 或者换句话说,&符只是用来表明变量a取地址后得到的值,被看作什么类型的指针,而不是用来表示对a进行取地址操作。

<think> 我们正在讨论C语言中数组首元素地址数组首地址的概念。根据引用[1][2][3][4]的内容,这两个概念在数值上通常相同,但语义上有重要区别。下面我将逐步解释: 1. **数组首元素地址**: - 即数组第一个元素的地址,例如对于`int arr[10]`,`arr`或`&arr[0]`都表示首元素地址。 - 类型为`int *`(指向整型的指针)。 - 进行指针算术运算时,加减操作以单个元素大小为步长(例如`arr+1`移动`sizeof(int)`字节)[^2][^4]。 2. **数组首地址**: - 即整个数组的起始地址,用`&arr`表示。 - 类型为`int (*)[10]`(指向包含10个整数的数组的指针)。 - 进行指针算术运算时,加减操作以整个数组大小为步长(例如`&arr+1`会跳过整个数组)[^2][^4]。 **示例分析**(引用[2][4]中的代码): ```c int arr[5] = {0}; printf("首元素地址: %p\n", (void*)arr); // 输出地址A printf("数组首地址: %p\n", (void*)&arr); // 同样输出地址A(数值相同) printf("首元素地址+1: %p\n", (void*)(arr+1)); // 地址A + sizeof(int) printf("数组首地址+1: %p\n", (void*)(&arr+1)); // 地址A + 5*sizeof(int) ``` **关键区别**: - **类型不同**:首元素地址是指向元素类型的指针,数组首地址是指向整个数组的指针。 - **运算步长不同**:基于类型差异,指针加减时的步长不同[^2][^3][^4]。 **常见误解澄清**(引用[1][3]): - 数组名在多数表达式中会退化为首元素地址(例如在函数传参时)。 - 但数组名并不完全等同于指针变量(它是常量,不可修改)[^1][^3]。 **总结**: - 两者在数值上相同,但类型语义不同。 - 通过指针运算可观察到差异:`arr+1`移动一个元素,`&arr+1`移动整个数组[^2][^4]。 §§相关问题§§ 1. 数组名在哪些情况下不会退化为指针? 2. 如何通过类型声明区分指向数组的指针指向数组首元素的指针? 3. 在函数参数中传递数组时,实际传递的是什么? 4. 多维数组的地址计算规则是怎样的? [^1]: 引用[1]提到数组名是指针(地址),但需注意其常量性。 [^2]: 引用[2]通过代码展示了地址运算差异。 [^3]: 引用[3]解释数组地址与首元素地址的关系。 [^4]: 引用[4]用地址运算sizeof结果验证类型差异。 </think> ### 数组首元素地址数组首地址的含义解析 #### 1. **数组首元素地址** - **定义**:数组第一个元素的内存地址 - **表示方式**: - `arr`(数组名直接使用) - `&arr[0]` - **关键特性**: - **类型为元素类型指针**(如`int arr[5]`则类型是`int*`) - **指针运算以元素大小为步长** ```c int arr[5]; printf("%p\n", arr); // 0x1000 printf("%p\n", arr + 1); // 0x1004 (int类型占4字节) ``` - 等价关系:`arr == &arr[0]` [^2][^4] #### 2. **数组首地址** - **定义**:整个数组的起始地址 - **表示方式**:`&arr` - **关键特性**: - **类型为数组类型指针**(如`int arr[5]`则类型是`int(*)[5]`) - **指针运算以整个数组大小为步长** ```c int arr[5]; printf("%p\n", &arr); // 0x1000 printf("%p\n", &arr + 1); // 0x1014 (5个int=20字节) ``` - 内存位置与首元素地址相同,但类型运算规则不同[^2][^3] #### 3. **核心区别总结** | 特性 | 首元素地址 (`arr`) | 数组首地址 (`&arr`) | |--------------|-------------------|-------------------| | **地址值** | 相同 (如0x1000) | 相同 (如0x1000) | | **指针类型** | 元素类型指针 (`int*`) | 数组类型指针 (`int(*)[5]`) | | **+1运算** | 前进1个元素大小 | 前进整个数组大小 | | **sizeof** | 返回指针大小(4/8字节) | 返回整个数组大小 | #### 4. **典型示例分析** ```c int arr[5] = {1,2,3,4,5}; printf("arr: %p\n", arr); // 0x1000 (int*) printf("&arr: %p\n", &arr); // 0x1000 (int(*)[5]) printf("arr+1: %p\n", arr+1); // 0x1004 (+4字节) printf("&arr+1: %p\n", &arr+1); // 0x1014 (+20字节) ``` - `arr+1`:移动到第二个元素(地址+4) - `&arr+1`:移动到下一个数组起始位置(地址+20)[^2][^4] #### 5. **特殊场景说明** - **数组名退化**:在大多数表达式中,数组名会退化为首元素地址 ```c void func(int* ptr); func(arr); // 实际传递的是首元素地址 ``` - **例外情况**(不退化为指针): - `sizeof(arr)` → 返回整个数组大小(20字节) - `&arr` → 取数组地址[^1][^3] #### 6. **类型系统的重要性** C编译器通过指针类型决定运算行为: ```c int (*p1)[5] = &arr; // 数组指针 int *p2 = arr; // 元素指针 p1 + 1; // 跳过整个数组(20字节) p2 + 1; // 跳过一个元素(4字节) ``` 类型差异解释了为何相同地址值却有不同运算结果[^4][^5]。 > **关键结论**:数组首元素地址数组首地址在数值上相同,但在类型系统指针运算规则上有本质区别。这种差异源于C语言对数组指针的类型处理机制[^3][^4]。
评论 35
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值