05 | 数组:为什么很多编程语言中数组都从0开始编号?

什么是数组?

数组(Array)是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据。

  • 线性表存储结构
  • 连续内存空间
  • 存储相同类型数据

优点:连续内存+相同类型数据=数组可以实现随机访问

缺点:数组中删除、插入一个数据,为了保证连续性,就需要做大量的数据搬移工作。

数组如何实现根据下标随机访问数组元素?

数组寻址公式

a[i]_address = base_address + i * data_type_size

data_type_size 表示数组中每个元素的大小,例如int类型data_type_size为4个字节。

数组和链表的区别

链表适合插入、删除;数组适合访问,访问数组元素的时间复杂度为O(1)。但是数组查找的复杂度并不为O(1)。即便是排好序的数组,你用二分查找,时间复杂度也是 O(logn)。

数组插入和删除复杂度分析

“插入”

  • 假设数组的长度为 n,现在,如果我们需要将一个数据插入到数组中的第 k 个位置头部插入时间移动n个元素,时间复杂度为O(n),尾部插入不需要移动元素,时间复杂度为O(1),每个位置插入元素的概率相同,平均时间复杂度为0(n)
  • 改进技巧:将某个数据插入到第k个位置,那么先将第k个位置元素移动到数组末尾(如果末尾空闲没有元素),再将新元素插入到第k位即可。从而使得时间复杂度降低为O(1),这个处理思想在快排中也会用到。
  • 如果插入多个元素,也可以合并第二步中提到的多次操作

“删除”

  • 删除数组末尾的数据,则最好情况时间复杂度为 O(1);如果删除开头的数据,则最坏情况时间复杂度为 O(n);平均情况时间复杂度也为 O(n);
  • 改进技巧:多次删除操作合并到一次执行,提高删除效率;
  • 数组 a[10]中存储了 8 个元素:a,b,c,d,e,f,g,h。现在,我们要依次删除 a,b,c 三个元素。为了避免 d,e,f,g,h 这几个数据会被搬移三次,先记录下已经删除的数据。每次的删除操作并不是真正地搬移数据,只是记录数据已经被删除。当数组没有更多空间存储数据时,我们再触发执行一次真正的删除操作,这样就大大减少了删除操作导致的数据搬移。
  • JVM标记清除垃圾回收算法的核心思想:先进行标记垃圾,等到内存可分配空间不足时,再出发一次垃圾回收清除标记的待回收对象即可。

警惕数组越界

容器PK数组:

什么时候用容器?ArrayList

  • rrayList 最大的优势就是可以将很多数组操作的细节封装起来。比如前面提到的数组插入、删除数据时需要搬移其他数据等。另外,它还有一个优势,就是支持动态扩容。每次存储空间不够的时候,它都会将空间自动扩容为 1.5 倍大小。
  • 扩容操作涉及内存申请和数据搬移,比较耗时。如果事先能确定需要存储的数据大小,最好在创建 ArrayList 的时候事先指定数据大小。
ArrayList<User> users = new ArrayList(10000);
for (int i = 0; i < 10000; ++i) {
  users.add(xxx);
}

什么时候用数组?

  • .Java ArrayList 无法存储基本类型,比如 int、long,需要封装为 Integer、Long 类,而 Autoboxing、Unboxing 则有一定的性能消耗,所以如果特别关注性能,或者希望使用基本类型,就可以选用数组。
  • 如果数据大小事先已知,并且对数据的操作非常简单,用不到 ArrayList 提供的大部分方法,也可以直接使用数组
  • 表示多维数组时,用数组往往会更加直观

总结:对于常规业务开发,使用容器更省时省力。损失一点性能,不会影响整体系统性能;如果是做底层开发比如网络模型框架、极致的性能优化等情况,数组优于容器。

线性表

  • 线状数据
  • 线性表上的数据最多只有前和后两个方向
  • 线性表除了数组还有:栈、队列、链表

非线性表

二叉树、堆、图等。之所以叫非线性,是因为,在非线性表中,数据之间并不是简单的前后关系

为什么多数编程语言中,数组下标编号从0开始?

  • 根据寻址公式,下标的确切定义是“偏移量”。首地址就是偏移量为0的位置,a【k】就表示偏移k个单位,这样使得寻址公式

a[k]_address = base_address + k * type_size简洁;否则从1开始计算,那么访问a【k】的寻址共识就变为
a[k]_address = base_address + (k-1)*type_size,对于底层cpu来说,多了一次减法指令运算。数组作为基础底层结构,效率的优化要做到极致。因为为了减少这一次减法操作,数组选择从0开始编号。

  • 历史原因,c语言从0开始计数数组下标,那么之后的Java,JavaScript效仿了c语言,从而降低了学习成本,保持了连贯性

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值