数组的定义
一种线性表结构,用一组连续的内存空间存储一组具有相同类型的数据。
- 线性表 数据排列成一条线一样的结构、数据只有前后两个方向。包括数组、链表、栈、队列都是线性表,但是图、树等数据结构,数据之间不是简单的前后关系所以不是线性表。
- 连续的内存空间 & 相同的数据类型这两个特性,让数组的随机访问变得容易。但是也让插入和删除变得低效,因为需要大量的数据迁移。
数组的寻址公式
随机访问: 支持在O(1) 时间复杂度内,按照洗标快速访问数组中的元素。
寻址公式:a[i]_address=base_address+i*data_type_size
data_type_size:表示数组中每个元素的大小
关于数组和链表的区别:
错误的说法:数组适合查找、且查找的时间复杂度为O(1)
数组即使排好序,使用二分查找,查找的复杂度也需要O(logn),正确的说法是,数组支持随机访问,根据下表访问元素的时间复杂度为O(1)
数组的低效插入和删除
长度为N的数组的插入
如果将元素插入到数组指定的位置K,那么则需要将原本自K开始的元素皆向后移动一位
追求数据的连续性的插入需要数据搬移:
- 最好时间复杂度O(1)插入数组尾部
- 最坏时间复杂度O(n)插入数组头部
- 平均时间复杂度(1+2+…+n)/n=O(n)插入每个位置概率相等。
不追求数据连续性的插入时间复杂度为O(1):
- 将需要插入的位置K设置为插入的值
- 将原本K位置的值、迁移到数组尾部
- 在快速排序中也用到了这种思想
长度为N的数组的删除
追求存储的连续性,需要数据搬移
- 删除数组尾部元素,时间复杂度最好为O(1)
- 删除数组头部元素,需要搬移所有元素复杂度为O(n)
- 删除任意元素,平均时间复杂度为O(n)
避免数据搬移标记删除
- 删除某些元素时,只对其进行标记删除,不进行数据搬移
- 容量不够用时,对所有已删除的数据进行统一删除,避免了每次进行数据搬移
- 这个方法也是JVM垃圾回收标记清除算法的核心思想
编程语言中容器跟数组的关系
容器的使用
- 容器把数组底层的扩容、迁移、插入、删除等操作细节的操作进行了封装
- 使用容器,尽量提前指定大小,避免扩容操作带来性能损耗
- 容器使得业务开发更方便
数组的作用
- 在面对基本类型数据时,使用数组,避免容器拆箱装箱带来性能损耗
- 在面对定长的数据和简单的数据操作时,可以使用数组提升性能。
- 多维数组对嵌套列表数据的表示更直观,不过是否使用还是看喜好
总结:日常开发使用封装的容器,例如ArrayList虽然会损失一点性能但是能利用容器的更快速的开发省时省力,但是如果在追求性能优化的场景下,可以使用数组更好。
数组的下标为何从0开始
理由1:从零开始寻址更简单
- 如果下标不从0开始,那么寻址a[i],地址将为
**a[i]_address=base_address+(i-1)*data_type_size**
** **这样将多了一次减法运算,不符合数组极限效率的追求。
理由2:历史原因
- C语言设计者,为了顺应其他语言的习惯,后来的java、javascript也是从0开始
- 也有其他的语言,不从0开始,例如MATLAB、还有python甚至支持负数下标。