Java数据结构 - 链表
1. 链表的概念及结构
链表是一种线性的数据结构,由有限的结点组成。其特点是结点的物理存储结构不一定连续,但逻辑顺序是连续的,通过链表中的引用链接次序实现。
- 从图中可以看到结点的逻辑顺序是连续的,但物理地址不一定是连续的。
- 每个结点都是通过new创建的,在堆上开辟内存空间。
- 从堆上申请的空间,是按照一定的策略来分配的,两次申请的空间可能连续,也可能不连续。
2. 不同的链表结构类型
实际中的链表多种多样,组合起来一共有8种类型。
虽然链表的结构类型有这么多,但是我们主要掌握两种:
-
无头单向非循环链表:结构简单,一般不会单独用来存储数据。实际中更多是作为其他数据结构的子结构,如哈希桶、图的邻接表等等。且这种结构在笔试面试中出现居多。
-
**无头双向非循环链表:**在Java的集合框架库中LinkedList底层实现就是无头双向循环链表
3. 实现一个简单的MyLinkedList
在这里,我们以无头双向链表为例,编写一个自己的MyLinkedList类。我们知道MyLinkedList是一个容器类,类中包含一个结点内部类,通过实例化该内部类来创建结点对象。MyLinkedList类中还具有对结点增删改查等的方法,类似ArrayList实现类,只是底层数据存储的结构不同。
因为前面已经学过了泛型知识,所以实现MyLinkedList为泛型类。
public class MyLinkedList<E>{
//结点内部类,包含结点实际存储元素和一对引用,分别指向上一个结点和下一个结点。
private static class Node<E>{
E element;
Node<E> prev;
Node<E> next;
Node(E e){
this.element = e;
}
Node(E e, Node<E> prev, Node<E> next){
this(e);
this.prev = prev;
this.next = next;
}
}
private int size; //记录当前结点数
private Node<E> head; //标记当前头结点
private Node<E> tail; //标记当前尾结点
/**
头插法,在当前链表头部插入一个新结点,然后修改指向,使新结点成为头结点。
*/
public void addFirst(E e){
Node newNode = new Node(e);
if(head == null){
head = newNode;
tail = newNode;
}else{
newNode.next = head;
head.prev = newNode;
head = newNode;
}
size++;
}
/**
尾插法,在当前链表的尾部插入一个新结点,然后修改尾结点指向。
*/
public void addLast(E e){
Node<E> newNode = new Node<>(e);
if(head == null){
head = newNode;
}else{
tail.next = newNode;
newNode.prev = tail;
}
tail = newNode;
size++;
}
/**
索引插法,在当前链表的逻辑索引处插入一个新结点
*/
public void addIndex(int index, E e){
if(index < 0 || index > size){ //索引检查
throw new IndexOutOfBoundsException("Index: " + index + ",Size: " + size);
}
if(index == 0){ //头插
addFirst(e);
return;
}
if(index == size){//尾插
addLast(e);
return;
}
Node<E> newNode = new Node<>(e);
Node<E> indexNode = findIndexNode(index); //找到当前索引位置的结点
//修改指向
newNode.prev = indexNode.prev;
newNode.next = indexNode;
indexNode.prev.next = newNode; //或者newNode.prev.next = newNode;
indexNode.prev = newNode; //或者newNode.next.prev = newNode;
size++;
}
private Node<E> findIndexNode(int index){
Node<E> cur = head;
while(index != 0){
cur = cur.next;
index--;
}
return cur;
}
/*
查询链表当中是否包含指定key
*/
public boolean contains(E key){
if(size == 0){
return false;
}
Node<E> cur = head;
while(cur != null){
if(cur.element.equals(key)){
return true;
}
cur = cur.next;
}
return false;
}
/*
删除链表当中第一次出现的key
*/
public E remove(E key){
Node<E> cur = head;
E oldElement = null;
while(cur != null){
if(cur.element.equals(key)){
oldElement = cur.element; //保存删除的key
if(cur == head){ //要删除的是头结点
head = head.next;
if(head != null){ //若头节点后面有结点
head.prev = null;
}else{
tail = null; //头节点后面无结点
}
}else{ //要删除的是不是头结点
cur.prev.next = cur.next;
if(cur.next != null){ //要删除的不是尾结点
cur.next.prev = cur.prev;
}else{
tail = cur.prev; //要删除的是尾结点
}
}
size--;
break;
}
cur = cur.next;
}
return oldElement;
}
/*
删除链表当中的所有key
*/
public void removeAll(E key){
Node<E> cur = head;
while(cur != null){
if(cur.element.equals(key)){
if(cur == head){ //要删除的是头结点
head = head.next;
if(head != null){ //若头节点后面有结点
head.prev = null;
}else{
tail = null; //头节点后面无结点
}
}else{ //要删除的是不是头结点
cur.prev.next = cur.next;
if(cur.next != null){ //要删除的不是尾结点
cur.next.prev = cur.prev;
}else{
tail = cur.prev; //要删除的是尾结点
}
}
size--;
}
cur = cur.next;
}
}
/*
清空链表
*/
public void clear(){
Node<E> cur = head;
while(cur != null){
Node<E> curNext = cur.next;
cur.prev = null;
cur.next = null;
cur = curNext;
}
head = null;
tail = null;
}
/*
打印当前链表的所有结点对象
*/
public void display(){
Node<E> cur = head;
while(cur != null){
System.out.println(cur.element);
cur = cur.next;
}
}
/*
获取当前链表的结点个数
*/
public int size(){
return size;
}
/*
返回当前链表是否为空链表
*/
public boolean isEmpty(){
return size == 0;
}
}
4. MyLinkedList源码解读
1、结点内部类。
当我们添加结点的时候,就是new了这个结点类的对象,然后将该对象的前后结点引用链接到其他结点上。
private static class Node<E>{
E element;
Node<E> prev;
Node<E> next;
Node(E e){
this.element = e;
}
Node(E e, Node<E> prev, Node<E> next){
this(e);
this.prev = prev;
this.next = next;
}
}
补充:为什么使用静态内部类?原因:如果使用普通内部类,创建其对象时依赖于外部类的实例,可以先理解为隐性引用着外部类实例。当想释放外部类的时候,GC无法对外部类对象进行回收,因为它还被引用着,如果不处理会导致后期内存泄漏。所以使用静态内部类的话,它不依赖于外部类,没有这种引用关系,能被各自回收。
2、size,head,tail 属性
这几个属性记录着当前MyLinkedList对象实体内存储的结点信息。
private int size; //记录当前结点数
private Node<E> head; //标记当前头结点
private Node<E> tail; //标记当前尾结点
3、addFirst头插法
首先new一个新结点并初始化结点值。如果当前添加是链表首次添加元素,使头尾指针引用当前新结点;如果当前链表有结点,使新结点的next引用头结点并让头结点的prev引用新结点,然后修改头结点指向,尾结点指向不变。
public void addFirst(E e){
Node newNode = new Node(e);
if(head == null){
head = newNode;
tail = newNode;
}else{
newNode.next = head;
head.prev = newNode;
head = newNode;
}
}
4、addLast尾插法
与addFirst前半段一样,首先new一个新结点并初始化结点值。如果链表为空则直接使头尾指针引用当前新结点;如果链表有结点,让尾结点的next引用新结点,新结点的prev引用尾结点,然后修改尾结点指向。
public void addLast(E e){
Node<E> newNode = new Node<>(e);
if(head == null){
head = newNode;
}else{
tail.next = newNode;
newNode.prev = tail;
}
tail = newNode;
size++;
}
5、addIndex索引插法
这里的索引并不真实存在与链表中,而是代表链表的逻辑索引,即第一个结点索引为0,第二个为1,以此类推。这里当我们要在指定索引插入新结点时可以分为几个步骤:
-
首先要对index进行检查,如果index不在当前有效范围之中就会抛异常。
-
若index为0,则进行头插法;若为size,则进行尾插法。
注意:不能省略return语句
-
若index不为两侧任一侧,则要插入的索引位置在两侧之中,我们首先找到index位置的结点,然后修改指向,这里需要分别修改四个指向
-
首先使新结点的prev链接上indexNode前侧的结点。
(一定不要先把indexNode的prev指向新结点,这样会丢掉indexNode前侧结点的链接)。
-
再将新结点的next链接上indexNode。
-
…
-
…
这里的2~3步方法不唯一,可根据习惯来。
-
-
我们可以把查询索引位置结点的操作分离出来,作一个新方法。即解耦,减少代码耦合。
public void addIndex(int index, E e){
if(index < 0 || index > size){ //索引检查
throw new IndexOutOfBoundsException("Index: " + index + ",Size: " + size);
}
if(index == 0){ //头插
addFirst(e);
return;
}
if(index == size){//尾插
addLast(e);
return;
}
Node<E> newNode = new Node<>(e);
Node<E> indexNode = findIndexNode(index); //找到当前索引位置的结点
//修改指向
newNode.prev = indexNode.prev;
newNode.next = indexNode;
indexNode.prev.next = newNode; //或者newNode.prev.next = newNode;
indexNode.prev = newNode; //或者newNode.next.prev = newNode;
size++;
}
private Node<E> findIndexNode(int index){
Node<E> cur = head;
while(index != 0){
cur = cur.next;
index--;
}
return cur;
}
6、contains方法
查找当前链表中是否包含key对象结点,从头遍历链表并使用equals方法来判断对象是否相等。
public boolean contains(E key){
if(size == 0){
return false;
}
Node<E> cur = head;
while(cur != null){
if(cur.element.equals(key)){
return true;
}
cur = cur.next;
}
return false;
}
7、remove方法
删除key对象结点的情况有四种,具体可以看下面的解析图。
/*
删除链表当中第一次出现的key
*/
public E remove(E key){
Node<E> cur = head;
E oldElement = null;
while(cur != null){
if(cur.element.equals(key)){
oldElement = cur.element; //保存删除的key
if(cur == head){ //要删除的是头结点
head = head.next;
if(head != null){ //若头节点后面有结点
head.prev = null;
}else{
tail = null; //头节点后面无结点
}
}else{ //要删除的是不是头结点
cur.prev.next = cur.next;
if(cur.next != null){ //要删除的不是尾结点
cur.next.prev = cur.prev;
}else{
tail = cur.prev; //要删除的是尾结点
}
}
size--;
break;
}
cur = cur.next;
}
return oldElement;
}
8、removeAll方法
这个方法的操作逻辑与remove方法基本一致,只不过当删除一个key之后不会直接跳出循环,而是使cur遍历到末尾,直到删除了所有的key,或者当前链表中不存在key对象。
/*
删除链表当中所有的key
*/
public void removeAll(E key){
Node<E> cur = head;
while(cur != null){
if(cur.element.equals(key)){
if(cur == head){ //要删除的是头结点
head = head.next;
if(head != null){ //若头节点后面有结点
head.prev = null;
}else{
tail = null; //头节点后面无结点
}
}else{ //要删除的是不是头结点
cur.prev.next = cur.next;
if(cur.next != null){ //要删除的不是尾结点
cur.next.prev = cur.prev;
}else{
tail = cur.prev; //要删除的是尾结点
}
}
size--;
}
cur = cur.next;
}
}
8、clear方法
清空当前链表中的所有结点,我们从头结点开始,依次断开与前后结点的链接,注意,要先保存一下当前结点之后的结点引用,不然会丢掉后面结点引用。
public void clear(){
Node<E> cur = head;
while(cur != null){
Node<E> curNext = cur.next;
cur.prev = null;
cur.next = null;
cur = curNext;
}
head = null;
tail = null;
}
5、概念面试题
数组和链表的区别是什么?顺序表和链表的区别是什么?ArrayList和LinkedList的区别是什么?
其实这三个问题本质上是一个问题。
我们可以从两者的异同点来解释:
1、从数据结构的角度来说:
顺序表和链表是线性表的两种不同的存储结构,链表是各结点的物理地址不一定连续,但逻辑顺序连续,链表主要分为两种:单向链表和双向链表,就拿双向链表来说,其表中的每个结点都有一对引用,分别指向该结点的前驱结点和后继结点。顺序表则是用一段地址连续的存储单元依次存放表中的数据元素。
2、从对元素增删改查的角度来说:
在数组中插入或删除一个元素时,时间复杂度为O(N),因为在i下标位置插入或删除一个元素时,需要移动N-i个元素,插入或删除元素时间O(1)+移动元素时间O(n-i)最坏时可以达到O(N),而相比,在链表头结点位置插入或删除一个元素时,时间复杂度仅为O(1),因为只需要修改头结点的引用指向,不用去移动任何元素。
在数组中查找或修改一个元素时,时间复杂度为O(1),因为数组默认是实现了RandomAccess接口,支持随机访问,通过数组下标可以直接访问到指定索引元素。而在链表中查找或修改一个元素时(不知道前驱结点的情况下),时间复杂度可以达到O(N),因为链表不能被随机访问,想要访问链表中间结点的位置,必须要先从头或尾结点开始。
3、从存储空间使用上来讲:
数组会浪费更多的空间,因为数组的长度是创建时指定的,当实际存储元素数量没有达到开始时指定的长度时,就会造成浪费。而且当长度不够时,还需要进行扩容,扩容时需要移动之前所有元素到新开辟的堆空间上,又会浪费不少时间。相比较链表来说,每个结点只需要多一个或一对引用变量,用来存储后一个或前后结点的地址,且链表没有长度的概念,使用时不用考虑事先开辟多大的空间,而是随用随取,空间浪费相对于数组来讲很小。
总的来说,当具体的业务频繁增删元素时,建议使用链表。当只需要查改指定元素时,建议使用数组。
在i下标位置插入或删除一个元素时,需要移动N-i个元素,插入或删除元素时间O(1)+移动元素时间O(n-i)最坏时可以达到O(N),而相比,在链表头结点位置插入或删除一个元素时,时间复杂度仅为O(1),因为只需要修改头结点的引用指向,不用去移动任何元素。
在数组中查找或修改一个元素时,时间复杂度为O(1),因为数组默认是实现了RandomAccess接口,支持随机访问,通过数组下标可以直接访问到指定索引元素。而在链表中查找或修改一个元素时(不知道前驱结点的情况下),时间复杂度可以达到O(N),因为链表不能被随机访问,想要访问链表中间结点的位置,必须要先从头或尾结点开始。
3、从存储空间使用上来讲:
数组会浪费更多的空间,因为数组的长度是创建时指定的,当实际存储元素数量没有达到开始时指定的长度时,就会造成浪费。而且当长度不够时,还需要进行扩容,扩容时需要移动之前所有元素到新开辟的堆空间上,又会浪费不少时间。相比较链表来说,每个结点只需要多一个或一对引用变量,用来存储后一个或前后结点的地址,且链表没有长度的概念,使用时不用考虑事先开辟多大的空间,而是随用随取,空间浪费相对于数组来讲很小。
总的来说,当具体的业务频繁增删元素时,建议使用链表。当只需要查改指定元素时,建议使用数组。
文章为本人独立编写,难免会有错误之处。
如发现有误,恳请评论提出!