文章出处:极客时间《数据结构和算法之美》-作者:王争。该系列文章是本人的学习笔记。
如何实现随机访问
数组是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据。
线性表
线性表的数据最多只有前和后两个方向。数组、栈、队列、链表都是线性表。
非线性表:树、图、堆。
连续的内存空间
a
[
i
]
_
a
d
d
r
e
s
s
=
b
a
s
e
_
a
d
d
r
e
s
s
+
i
∗
d
a
t
a
_
t
y
p
e
_
s
i
z
e
a[i]\_address=base\_address+i*data\_type\_size
a[i]_address=base_address+i∗data_type_size,data_type_size表示数组中每个元素的大小。
如果数组下标从1开始,那么在查找
a
[
i
]
_
a
d
d
r
e
s
s
=
b
a
s
e
_
a
d
d
r
e
s
s
+
(
i
−
1
)
∗
d
a
t
a
_
t
y
p
e
_
s
i
z
e
a[i]\_address=base\_address+(i-1)*data\_type\_size
a[i]_address=base_address+(i−1)∗data_type_size会多一次减法操作。这可能是大多数语言数组下标从0开始的原因。
与链表的区别
数组支持随机访问,复杂度O(1)。链表适合插入删除。
低效地插入和删除
插入:如果某个位置a[i]已经被占用了,就需要将i到最后一个元素拷贝到i+1到count位置,然后a[i]=val。平均时间复杂度O(n)。
改进策略:大多数时候我们不需要追求顺序性,那么我们可以把a[i]复制到数组末尾,将 当前元素赋值给a[i]。例如数组a[10],已经存入元素:1,2,3,4,5。现在想插入a[2]=10,那么插入完成后数组变为:1,2,10,4,5,3。
删除:因为内存块是连续的,当删除i位的元素后,从i+1到count的元素需要向前迁移。这样平均复杂度也是O(n)。
删除的改进策略可以是:删除的位置先做标记不做迁移,等空间不够的时候再做迁移。这就是Java虚拟的标记清除算法。
警惕数组越界
数组越界是通常需要处理的问题。在C中数组越界可能会产生意想不到的结果。
容器能否完全替代数组
在某些场合还是用数组不会用容器。例如:
1 数组可以存储基本数据类型,速度上更快。在已知数组大小,并且操作简单的情况下数组是个更好的选择。
2 多维数组一般用数组表示。a[][] 这样的表示比List<List> 这样的结构更容易接受。