C语言的数组元素下标为何从0开始?
我们在学习数组时会有这个疑问,数组元素的下标为什么不从1开始呢?
从1开始不是更符合大家的日常习惯吗?生活中我们通常说第1个,而不是第0个。
的确,有些计算机语言如早期的Pascal语言,数组元素的下标是从1开始的。难道是C语言故意要与众不同?要弄清楚这个问题,得先看一下计算机底层是怎样处理数组元素的。我们先编写了一个小程序,然后在VS编译器中对其进行了反汇编。
源代码和反汇编后的部分代码如下:
int arr[5];//一个全局数组
int main()
{
int i;
for (i = 0; i < 5; i++)
{
arr[i] = 9;
}
return 0;
}
上表中除了程序的源代码,在其它部分中,最左列是指令的地址,中间是机器码,也就是机器最后执行的代码,右列是对应的汇编语言代码。
我们重点看一下这一句汇编代码:
mov dword ptr [eax*4 + 01019580h] , 9
它的功能就是arr[i] = 9,其中eax中存放着变量i的值,4表示每个元素占4个字节,01019580h是数组arr的首地址,为了确认,可以在监视窗口中键入arr或者&arr[0],我们可以看到它们的值等于0x01019580h,如下图所示:
也就是说,在给第i个元素赋值时,先要计算它的地址,即:首地址+i*4,
在这个例子中,首地址是01019580h,所以第0个元素存放在以01019580h 开始的4个字节中,第1个元素存放在以01019584h 开始的4个字节中,…,第4个元素存放在以01019590h 开始的四个字节中。
计算出地址后,用mov指令将9传递到该地址开始的4个字节中存放。执行完for循环后,查看01019580h开始的内存情况,如下图所示:
可以看到,以0x01019580h开始的连续20个字节中存放着5个9。
从上面看出,当数组元素下标从0开始时,每个元素的地址计算如下:
第0个元素地址:首地址 (首地址 + 0*4)
第1个元素地址:首地址 + 1*4
第2个元素地址:首地址 + 2*4
........
第i个元素地址:首地址 + i*4
当数组元素下标从1开始时,每个元素的地址计算如下:
第1个元素地址:首地址
第2个元素地址:首地址 +(2-1)*4
第3个元素地址:首地址 +(3-1)*4
.........
第i个元素地址:首地址 +(i-1)*4
很明显,如果数组元素下标从1开始,每次计算地址时,需要多做一次减法操作。因此,为了提高效率,C语言数组元素下标从0开始。C语言的高效率就大大的提升了!!!