Java8 LinkedList源码分析

最新推荐文章于 2024-07-05 17:30:16 发布

却把清梅嗅

最新推荐文章于 2024-07-05 17:30:16 发布

阅读量1k

点赞数

文章标签： java linkedlist 链表结构

本文链接：https://blog.csdn.net/mq2553299/article/details/76551221

版权

Java 专栏收录该内容

30 篇文章 0 订阅

订阅专栏

学习动机

Java Collection库中有三类：List，Queue，Set；而List接口，有三个子实现类：ArrayList，Vector，LinkedList。

LinkedList采用的双向链表结构，和ArrayList的数组结构不同，链表结构的优势就是便于大量的数据添加和删除，但对于ArrayList擅长的数据查询则并非擅长。

本文进行LinkedList源码的分析。

构造&成员属性

成员变量

    //容器的size
    transient int size = 0;

    //类似于指针，记录着链表的第一个数据
    transient Node<E> first;

    //连边的最后一个数据
    transient Node<E> last;

看一下Node的内部：

private static class Node<E> {
    E item;//存储的数据
    Node<E> next;//指向链表的下一个数据
    Node<E> prev;//链表的前一个数据

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

我们可以看到，LinkedList的内部实际上是有若干个相连的Node节点组成的，每个Node节点都包含着该节点的数据、前一个节点、后一个节点。、

构造方法如下：

public LinkedList() {
}

public LinkedList(Collection<? extends E> c) {
    this();
    addAll(c);
}

构造方法很简单，第二个构造中传入了一个Collection集合，也只是执行了addAll(c)方法。

add()方法分析

准备

照常理我们要尝试分析add()相关方法了，在这之前我们先看一下几个核心的元素插入方法：

private void linkFirst(E e)
void linkLast(E e)
void linkBefore(E e, Node succ)

  //将数据作为FirstNode插入链表
    private void linkFirst(E e) {
        //取得链表第一个元素
        final Node<E> f = first;
        //初始化数据,新建一个Node对象，该对象中数据为要插入的新数据
        //同时，该数据的前一个节点为null(当然因为它是首个节点)
        //该数据的后一个节点为之前的first节点
        final Node<E> newNode = new Node<>(null, e, f);
        first = newNode;
        if (f == null)
            //如果之前的首个节点（现在应该是第二个）为空，说明执行该插入操作前，链表为空
            //新节点既是首节点，也是尾节点（因为现在链表元素size = 1）
            last = newNode;
        else
            //否则说明之前不是空链表
            //之前的首个节点的前一个节点变成新的首节点
            f.prev = newNode;
        size++;
        modCount++;
    }
    //将数据作为LastNode插入链表
    void linkLast(E e) {
        final Node<E> l = last;
        final Node<E> newNode = new Node<>(l, e, null);
        last = newNode;
        if (l == null)
            first = newNode;
        else
            l.next = newNode;
        size++;
        modCount++;
    }
    //将数据插入到某个链表节点之前
    void linkBefore(E e, Node<E> succ) {
        // assert succ != null;
        final Node<E> pred = succ.prev;
        final Node<E> newNode = new Node<>(pred, e, succ);
        succ.prev = newNode;
        if (pred == null)
            first = newNode;
        else
            pred.next = newNode;
        size++;
        modCount++;
    }

理解任意一个核心方法,剩下两个方法也就不难理解了，我们以linkBefore为例：

步骤1：执行linkBefore时，LinkedList的数据结构
linkBefore1

步骤2：执行final Node newNode = new Node<>(pred, e, succ);
linkBefore2

步骤3：执行pred.next = newNode;
linkBefore3

add()方法

public boolean add(E e) {
    //其实只是执行linkLast方法将数据添加到链表末尾
    linkLast(e);
    return true;
}

public void add(int index, E element) {
    checkPositionIndex(index);
    //将元素插入，也是执行了linklast或linkBefore方法
    if (index == size)
        linkLast(element);
    else
        linkBefore(element, node(index));
}
//将Collection中元素插入LinkedList最后
public boolean addAll(Collection<? extends E> c) {
    //如果我们在构造中传入一个Collection，实际会走下面的代码
    return addAll(size, c);
}

//将Collection中元素插入LinkedList指定index
public boolean addAll(int index, Collection<? extends E> c) {
    checkPositionIndex(index);//检查是否越界，若越界抛出IndexOutOfBoundsException异常
    //先将集合转化为数组
    Object[] a = c.toArray();
    int numNew = a.length;
    //如果数组为空，返回false，方法执行结束
    if (numNew == 0)
        return false;

    Node<E> pred, succ;
    if (index == size) {
        //说明是通过构造初始化链表，此时链表中数据为空
        succ = null;//succ: 索引位置从指定集合插入的第一个元素
        pred = last;//pred: 插入数组的第一个元素节点
    } else {
        //node（index）方法是获取对应index的Node对象
        succ = node(index);
        pred = succ.prev;
    }

    //将数组中元素转换为一个链表，pred永远代表第一个Node节点
    for (Object o : a) {
        @SuppressWarnings("unchecked") E e = (E) o;
        Node<E> newNode = new Node<>(pred, e, null);
        if (pred == null)
            first = newNode;
        else
            pred.next = newNode;
        pred = newNode;
    }

    //将新的链表插入原有链表
    if (succ == null) {
        last = pred;
    } else {
        pred.next = succ;
        succ.prev = pred;
    }

    //size修改，修改次数modCount++
    size += numNew;
    modCount++;
    return true;
}

add相关方法基本就这些，当然还有两个简单的，特此列出，不赘述:

public void addFirst(E e) {
    linkFirst(e);
}

public void addLast(E e) {
    linkLast(e);
}

remove代码分析

先看一下remove相关的核心方法：

//删除第一个节点
private E unlinkFirst(Node<E> f) {
    final E element = f.item;
    final Node<E> next = f.next;
    f.item = null;
    f.next = null; // help GC
    first = next;
    if (next == null)
        last = null;
    else
        next.prev = null;
    size--;
    modCount++;
    return element;
}
//删除last节点
private E unlinkLast(Node<E> l) {
    final E element = l.item;
    final Node<E> prev = l.prev;
    l.item = null;
    l.prev = null; // help GC
    last = prev;
    if (prev == null)
        first = null;
    else
        prev.next = null;
    size--;
    modCount++;
    return element;
}
//删除某个节点
E unlink(Node<E> x) {
    // 临时保存移除对象的所有数据（prev和next指针以及存储数据）
    final E element = x.item;
    final Node<E> next = x.next;
    final Node<E> prev = x.prev;
    //prev指针为null，则说明该对象为头节点
    if (prev == null) {
        first = next;
    } else {
        prev.next = next;
        x.prev = null;
    }
    //next指针为null，则说明该对象为尾节点
    if (next == null) {
        last = prev;
    } else {
        next.prev = prev;
        x.next = null;
    }

    x.item = null;
    size--;
    modCount++;
    return element;
}

同样理解任意一个核心方法,剩下两个方法也就不难理解了，我们以unlink(Node x)为例：

步骤1：执行remove操作前的数据结构
linkBefore1

步骤2：执行prev指针相关
linkBefore2

步骤3：执行next指针相关
linkBefore3

remove代码分析

//按index删除节点很简单，node方法获取到对应的元素，然后unlink删除即可
public E remove(int index) {
    checkElementIndex(index);
    return unlink(node(index));
}
//按对象删除，依次遍历链表，然后找到首个符合的元素，然后删除该元素
public boolean remove(Object o) {
    if (o == null) {
        for (Node<E> x = first; x != null; x = x.next) {
            if (x.item == null) {
                unlink(x);
                return true;
            }
        }
    } else {
        for (Node<E> x = first; x != null; x = x.next) {
            if (o.equals(x.item)) {
                unlink(x);
                return true;
            }
        }
    }
    return false;
}

//同样没啥好说的，移除第一个Node
public E removeFirst() {
    final Node<E> f = first;
    if (f == null)
        throw new NoSuchElementException();
    return unlinkFirst(f);
}
//移除最后一个Node
public E removeLast() {
    final Node<E> l = last;
    if (l == null)
        throw new NoSuchElementException();
    return unlinkLast(l);
}

node(int index)

我们来看一看node方法是如何找到对应index的元素节点的：

Node<E> node(int index) {
    if (index < (size >> 1)) {
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

可以看到，类似于二分查找法，第一次查找根据index判断是从头部还是尾部获取对应元素，相对于数组结构，性能还是有所欠缺。

小结

优点：

LinkedList没有大小限制

没有浪费存储空间（Node节点的创建需要额外消耗少量空间）

add，remove等操作的空间消耗是固定的，不会造成对元素进行额外的移动拷贝

缺点：

除了对首尾元素外，对其他节点，进行add，remove，set，get等操作，都需要进行遍历查找的，时间复杂度为O(n)

应用场景

查询操作少，存储大量数据，可以考虑使用LinkedList

多线程下：

LinkedList和ArrayList一样，都不是线程安全的。

在考虑线程安全的情况下，可以使用 ConcurrentLinkedQueue代替LinkedList，直接同步LinkedList对象，或者使用

List list = Collections.synchronizedList(new LinkedList(…));

对比ArrayList

ArrayList和LinkedList的大致区别如下:
* 1.ArrayList是实现了基于动态数组的数据结构，LinkedList基于链表的数据结构。
* 2.对于随机访问get和set，ArrayList优于LinkedList，因为LinkedList要移动指针遍历查找。
* 3.对于新增和删除操作add和remove，LinedList比较占优势，因为ArrayList要移动数据。

当我们在集合中装5万条数据，测试运行结果如下:

显然我们可以看出ArrayList更适合读取数据，linkedList更多的时候添加或删除数据。

ArrayList内部是使用可増长数组实现的，所以是用get和set方法是花费常数时间的，但是如果插入元素和删除元素，除非插入和删除的位置都在表末尾，否则代码开销会很大，因为里面需要数组的移动。
LinkedList是使用双链表实现的，所以get会非常消耗资源，除非位置离头部很近。但是插入和删除元素花费常数时间。