部分来源于其他博客
为什么数组的下标是从0开始,而不是从1开始呢?从1开始不是更符合人们的习惯么。
数组(Array)一种线性表数据结构,用一组连续的内存空间,存储一组相同类型的数据
线性表(Linear List),每个线性表上最多有前后两个方向。 数组、队列、链表、栈都是线性表结构
非线性表,如二叉树、堆、图等。在非线性表中,数据不是简单的前后关系。
连续的内存空间和相同的数据结构,使其可以“随机访问”,弊端也很明显,某些操作十分低效。在数组中删除或插入数据时,要做大量的数据搬移工作。
从数组中存储的数据模型来看,下标最精确的意思是”偏移量“,a[0]的偏移量是0,即为首地址。a[i]的偏移量是i,寻址公式就是a[i]_address = base_address + i*data_type_size
如果下标从1开始,那对应的寻址公式a[i]_address = base_address + (i-1)*data_type_size
对CPU来说,每次随机访问,就多了一次运算,多发一条指令。
上面的解析,算不上压倒性的证明。当初C语言的设计者用0开始计数数组下标,之后java、javaScript等高级语言都仿效了C语言,这也减少了C语言程序员学习java的成本。
简单来说,就是
假如数组的首地址 是 base_address
如果索引从 1 开始计,元素 a[1] 是第一个元素,它的地址就是 base_address,当我们要获取第 8 个元素 a[8] 的数据时,计算机就要找到元素 a[8] 所在的地址,计算公式就是 base_address + (8-1)* type_size 。
如果索引从 0 开始计,元素 a[0] 是第一个元素,它的地址就是 base_address,当我们要获取第 8 个元素 a[7] 的数据时,计算机就要找到元素 a[7] 所在的地址,计算公式就是 base_address + 7 * type_size 。
我们发现,索引从 0 开始,寻址时会少做一次减法,这就是一个优化,别小看这种优化,计算的数量一旦上去,比如上亿次计算,那积累起来的优势是相当可观的。
其实,各种算法的优化,本质都是一样的,让计算机做更少的计算,只有做的事情少了,效率才会提高。