一、与数组的比较
1.数据结构不同
数组需要连续的内存空间来存储,对内存的要求比较高。比如申请一个100MB大小的数组,如果内存中没有连续的、足够大的存储空间,即使内存的剩余总可用空间大于100MB,仍然会申请失败。
而链表恰恰相反,它并不需要一块连续的内存空间,它通过“指针”将一组零散的内存块串联起来使用,所以如果我们申请的是 100MB 大小的链表,只要内存够用,就不会有问题。
2. 复杂度不同
查询复杂度不同
数组由于连续存储,所以可随机访问任意元素。复杂度为O(1)。
链表查询需要根据指针一个结点一个结点地依次遍历,直到找到相应的结点。复杂度为O(n)。
插入和删除复杂度不同
数组由于连续存储,插入和删除元素,都要将后面的元素全部挪动,所以时间复杂度是 O(n)。
链表只需要将相邻节点的指针改变指向就行,时间复杂度是 O(1)。
3. 链表 VS 数组性能大比拼
二、链表结构
1.单链表
最简单、最常用的链表结构。
有两个结点是比较特殊的,它们分别是第一个结点和最后一个结点。我们习惯性地把第一个结点叫作头结点,把最后一个结点叫作尾结点。
头结点用来记录链表的基地址。有了它,我们就可以遍历得到整条链表。
而尾结点特殊的地方是:指针不是指向下一个结点,而是指向一个空地址 NULL,表示这是链表上最后一个结点。
2.循环链表和双向链表
循环列表解决“约瑟夫问题”。
由图可知,存储相同数据量,双向链表占用的内存更多。
Java语言中的 LinkedHashMap 容器的实现原理就是用到了双向链表这种数据结构。
双向链表解决哪些问题呢?
实际上,在某些情况下,双向链表在查询、插入和删除的效率都比单链表要高。
你可能会问,单链表的插入和删除已经是O(1)了,双向链表还能怎么提高呢?
先来看删除操作的两种情况:
- 删除结点中“值等于某个给定值”的结点;
- 删除给定指针指向的结点。
对于第一种情况,删除结点之前都要查询,单链表和双向链表的查询复杂度没有区别。
对于第二种情况,我们已经找到了要删除的结点,但是删除某个结点 q 需要知道其前驱结点,而单链表并不支持直接获取前驱结点,所以,为了找到前驱结点,我们还是要从头结点开始遍历链表,直到 p->next=q,说明 p 是 q 的前驱结点。单链表删除操作需要 O(n) 的时间复杂度。
但是对于双向链表来说,这种情况就比较有优势了。因为双向链表中的结点已经保存了前驱结点的指针,不需要像单链表那样遍历。双向链表只需要在 O(1) 的时间复杂度内就搞定了。
除了插入、删除操作有优势之外,对于一个有序链表,双向链表的按值查询的效率也要比单链表高一些。因为,我们可以记录上次查找的位置 p,每次查询时,根据要查找的值与 p 的大小关系,决定是往前还是往后查找,所以平均只需要查找一半的数据。
现在,你有没有觉得双向链表要比单链表更加高效呢?这就是为什么在实际的软件开发中,双向链表尽管比较费内存,但还是比单链表的应用更加广泛的原因。但更需要掌握的是——用空间换时间的设计思想。
总结
数组简单易用,在实现上使用的是连续的内存空间,可以借助 CPU 的缓存机制,预读数组中的数据,所以访问效率更高。而链表在内存中并不是连续存储,所以对 CPU 缓存不友好,没办法有效预读。
数组的缺点是大小固定,一经声明就要占用整块连续内存空间。如果声明的数组过大,系统可能没有足够的连续内存空间分配给它,导致“内存不足(out of memory)”。如果声明的数组过小,则可能出现不够用的情况。这时只能再申请一个更大的内存空间,把原数组拷贝进去,非常费时。
Java 中的 ArrayList 容器,虽然也可以支持动态扩容,但每次扩容都意味着原来的数组的内容全部迁移到新数组中。想想,如果数据量1GB,数据拷贝是不是非常耗时?