很多同学可能在学习数组时会有这个疑问,下标为什么不从1开始呢?从1开始不是更符合大家的日常习惯吗?生活中我们通常说第1个,而不是第0个。的确,有些计算机语言如早期的Pascal语言,数组元素的下标是从1开始的。难道是C语言故意要与众不同?要弄清楚这个问题,得先看一下计算机底层是怎样处理数组元素的。我们先编写了一个小程序,然后在visual
studio中对其进行了反汇编。源程序和反汇编后的部分代码如下:
源程序:
int arr[5]; //一个全局数组
int main()
{
int i;
for (i =0;i < 5;i++)
arr[i] = 9;
return 0;
}
反汇编后的部分代码:
int i;
for (i = 0; i < 5; i++)
0101168E
C7 45 F8 00 00 00 00
mov dword ptr [ebp-8], 0
01011695
EB 09
jmp 010116A0
01011697
8B 45 F8
mov eax, dword ptr [ebp-8]
0101169A
83 C0 01
add eax,1
0101169D
89 45 F8
mov dword ptr [ebp-8],eax
010116A0
83 7D F8 05
cmp dword ptr [ebp-8],5
010116A4
7D 10
jge 010116B6
arr[i] = 9;
010116A6
8B 45 F8
mov eax,dword ptr [ebp-8]
010116A9
C7 04 85 80 95 01 01 09 00 00 00
mov dword ptr [eax*4+01019580h], 9
010116B4
EB E1
jmp 01011697
return 0;
010116B6
33 C0
xor eax,eax
上表中除了程序源代码,其它部分中,最左列是指令的地址,中间是机器码,也就是机器最后执行的代码,右列是对应的汇编语言代码。可能初学者看不懂这些汇编代码,没有关系。我们重点看一下这一句:mov dword ptr
[eax*4 + 01019580h], 9它的功能就是arr[i] = 9,其中eax中存放着变量i的值,4表示每个元素占4个字节,01019580h是数组arr的首地址,为了确认,可以在监视窗口中键入arr或者&arr[0],我们可以看到它们的值等于0x01019580h,如下图所示:

也就是说,在给第i个元素赋值时,先要计算它的地址,即:首地址+i*4,在这个例子中,首地址是01019580h,所以第0个元素存放在以01019580h开始的四个字节中,第1个元素存放在以01019584h开始的四个字节中,…,第4个元素存放在以01019590h开始的四个字节中。计算出地址后,用mov指令将9传递到该地址开始的4个字节中存放。执行完for循环后,查看01019580h开始的内存情况,如下图所示:

可以看到,以0x01019580h开始的连续20个字节中存放着5个9。
从上面看出,当数组元素下标从0开始时,每个元素的地址计算如下:
第0个元素地址:首地址(首地址+0*4)
第1个元素地址:首地址+1*4
第2个元素地址:首地址+2*4
…
第i个元素地址:首地址+i*4
当数组元素下标从1开始时,每个元素的地址计算如下:
第1个元素地址:首地址
第2个元素地址:首地址+(2-1)*4
第3个元素地址:首地址+(3-1)*4
…
第i个元素地址:首地址+(i-1)*4
很明显,如果数组元素下标从1开始,每次计算地址时,需要多做一次减法操作。因此,为了提高效率,C语言数组元素下标从0开始。C语言的高效率就是体现在这些点点滴滴中的,需要在学习中慢慢体会!
本文揭示了C语言数组下标从0开始的设计原因,通过反汇编分析指出,从0开始能简化地址计算,提高效率。通过详细解释地址计算过程,展示了数组元素布局与下标的关系,并强调了这种设计背后的高效原则。
645

被折叠的 条评论
为什么被折叠?



