数组
是一种线性表数据结构,它是用一组连续的内存空间,来存储一组具有相同类型的数据
线性表
每个线性表的数据最多只有前后两个方向,其实除了数组,链表\队列\栈等也是线性表结构
非线性表
比如 二叉树 堆 图,之所以叫做非线性表,是因为,在非线性表中,数据之间并不是简单的前后关系
数组和链表的区别
链表适合插入\删除\时间复杂度是O(1)
数组适合查找,但是查找的时间复杂度不是O(1),时间复杂度是O(logn),数组支持随机访问,根据下标访问的时间复杂度是O(1)
链表的增删不会产生数据的搬移(链表不是必须需要连续内存来存储的),而数组为保持内存的连续性,删除增加数据的时候要进行数据的搬移
数组的插入复杂度
假设数组的长度为n,现在,如果我们需要将一个数据插入到数组中的第k个位置。为了把第k个位置腾出来,给新来的数据,我们需要将第k~n这部分的元素都顺序地往后挪一位。那插入操作的时间复杂度是多少呢?你可以自己先试着分析一下。
如果在数组的末尾插入元素,那就不需要移动数据了,这时的时间复杂度为O(1)。但如果在数组的开头插入元素,那所有的数据都需要依次往后移动一位,所以最坏时间复杂度是O(n)。 因为我们在每个位置插入元素的概率是一样的,所以平均情况时间复杂度为(1+2+…n)/n=O(n)。
如果数组中的数据是有序的,我们在某个位置插入一个新的元素时,就必须按照刚才的方法搬移k之后的数据。但是,如果数组中存储的数据并没有任何规律,数组只是被当作一个存储数据的集合。在这种情况下,如果要将某个数组插入到第k个位置,为了避免大规模的数据搬移,我们还有一个简单的办法就是,直接将第k位的数据搬移到数组元素的最后,把新的元素直接放入第k个位置。
数组的删除操作
数组为什么要从0开始
从数组的内存模型上来看,”下标”最确切的定义应该应该是”偏移(offset)”.前边也讲到,如果用a来表示数组的首地址,a[0]就是偏移为0
的位置,也就是首地址,a[k]就表示偏移k个type_size的位置,所以计算a[k]的内存地址只需要用到这个公式
a[k]_address = base_address + k * type_size
但是,如果数组从1开始计数,那我们计算数组元素
a[k]a[k]_address = base_address + (k-1)*type_size
对比两个公式,我们不难发现,从1开始编号,每次随机访问数组元素都多了一次减法运算,对于CPU来说,就是多了一次减法指令
数组作为非常基础的数据结构,通过下标随机访问数组元素又是其非常基础的编程操作,效率的优化就要尽可能做到极致。所以为了减择了从0开始编号,而不是从1开始。不过我认为,上面解释得再多其实都算不上压倒性的证明,说数组起始编号非0开始不可。所以我觉得最主要的原因可能是历史原因。
数组小结
数组用一块连续的内存空间,来存储相同类型的一组数据,最大的特点就是支持随机访问,当时插入\删除操作也会变得比较低效,平均情况时间复杂度为O(n)