Java8 LinkedList源码分析

学习动机

Java Collection库中有三类:List,Queue,Set;而List接口,有三个子实现类:ArrayList,Vector,LinkedList。

LinkedList采用的双向链表结构,和ArrayList的数组结构不同,链表结构的优势就是便于大量的数据添加和删除,但对于ArrayList擅长的数据查询则并非擅长。

本文进行LinkedList源码的分析。

构造&成员属性

成员变量

    //容器的size
    transient int size = 0;

    //类似于指针,记录着链表的第一个数据
    transient Node<E> first;

    //连边的最后一个数据
    transient Node<E> last;

看一下Node的内部:

private static class Node<E> {
    E item;//存储的数据
    Node<E> next;//指向链表的下一个数据
    Node<E> prev;//链表的前一个数据

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

我们可以看到,LinkedList的内部实际上是有若干个相连的Node节点组成的,每个Node节点都包含着该节点的数据、前一个节点、后一个节点。、

构造方法如下:

public LinkedList() {
}

public LinkedList(Collection<? extends E> c) {
    this();
    addAll(c);
}

构造方法很简单,第二个构造中传入了一个Collection集合,也只是执行了addAll(c)方法。

add()方法分析

准备

照常理我们要尝试分析add()相关方法了,在这之前我们先看一下几个核心的元素插入方法:

private void linkFirst(E e)
void linkLast(E e)
void linkBefore(E e, Node succ)

  //将数据作为FirstNode插入链表
    private void linkFirst(E e) {
        //取得链表第一个元素
        final Node<E> f = first;
        //初始化数据,新建一个Node对象,该对象中数据为要插入的新数据
        //同时,该数据的前一个节点为null(当然因为它是首个节点)
        //该数据的后一个节点为之前的first节点
        final Node<E> newNode = new Node<>(null, e, f);
        first = newNode;
        if (f == null)
            //如果之前的首个节点(现在应该是第二个)为空,说明执行该插入操作前,链表为空
            //新节点既是首节点,也是尾节点(因为现在链表元素size = 1)
            last = newNode;
        else
            //否则说明之前不是空链表
            //之前的首个节点的前一个节点变成新的首节点
            f.prev = newNode;
        size++;
        modCount++;
    }
    //将数据作为LastNode插入链表
    void linkLast(E e) {
        final Node<E> l = last;
        final Node<E> newNode = new Node<>(l, e, null);
        last = newNode;
        if (l == null)
            first = newNode;
        else
            l.next = newNode;
        size++;
        modCount++;
    }
    //将数据插入到某个链表节点之前
    void linkBefore(E e, Node<E> succ) {
        // assert succ != null;
        final Node<E> pred = succ.prev;
        final Node<E> newNode = new Node<>(pred, e, succ);
        succ.prev = newNode;
        if (pred == null)
            first = newNode;
        else
            pred.next = newNode;
        size++;
        modCount++;
    }

理解任意一个核心方法,剩下两个方法也就不难理解了,我们以linkBefore为例:

步骤1:执行linkBefore时,LinkedList的数据结构
linkBefore1

步骤2:执行final Node newNode = new Node<>(pred, e, succ);
linkBefore2

步骤3:执行pred.next = newNode;
linkBefore3

add()方法

public boolean add(E e) {
    //其实只是执行linkLast方法将数据添加到链表末尾
    linkLast(e);
    return true;
}

public void add(int index, E element) {
    checkPositionIndex(index);
    //将元素插入,也是执行了linklast或linkBefore方法
    if (index == size)
        linkLast(element);
    else
        linkBefore(element, node(index));
}
//将Collection中元素插入LinkedList最后
public boolean addAll(Collection<? extends E> c) {
    //如果我们在构造中传入一个Collection,实际会走下面的代码
    return addAll(size, c);
}

//将Collection中元素插入LinkedList指定index
public boolean addAll(int index, Collection<? extends E> c) {
    checkPositionIndex(index);//检查是否越界,若越界抛出IndexOutOfBoundsException异常
    //先将集合转化为数组
    Object[] a = c.toArray();
    int numNew = a.length;
    //如果数组为空,返回false,方法执行结束
    if (numNew == 0)
        return false;

    Node<E> pred, succ;
    if (index == size) {
        //说明是通过构造初始化链表,此时链表中数据为空
        succ = null;//succ: 索引位置从指定集合插入的第一个元素
        pred = last;//pred: 插入数组的第一个元素节点
    } else {
        //node(index)方法是获取对应index的Node对象
        succ = node(index);
        pred = succ.prev;
    }

    //将数组中元素转换为一个链表,pred永远代表第一个Node节点
    for (Object o : a) {
        @SuppressWarnings("unchecked") E e = (E) o;
        Node<E> newNode = new Node<>(pred, e, null);
        if (pred == null)
            first = newNode;
        else
            pred.next = newNode;
        pred = newNode;
    }

    //将新的链表插入原有链表
    if (succ == null) {
        last = pred;
    } else {
        pred.next = succ;
        succ.prev = pred;
    }

    //size修改,修改次数modCount++
    size += numNew;
    modCount++;
    return true;
}

add相关方法基本就这些,当然还有两个简单的,特此列出,不赘述:

public void addFirst(E e) {
    linkFirst(e);
}

public void addLast(E e) {
    linkLast(e);
}

remove代码分析

先看一下remove相关的核心方法:

//删除第一个节点
private E unlinkFirst(Node<E> f) {
    final E element = f.item;
    final Node<E> next = f.next;
    f.item = null;
    f.next = null; // help GC
    first = next;
    if (next == null)
        last = null;
    else
        next.prev = null;
    size--;
    modCount++;
    return element;
}
//删除last节点
private E unlinkLast(Node<E> l) {
    final E element = l.item;
    final Node<E> prev = l.prev;
    l.item = null;
    l.prev = null; // help GC
    last = prev;
    if (prev == null)
        first = null;
    else
        prev.next = null;
    size--;
    modCount++;
    return element;
}
//删除某个节点
E unlink(Node<E> x) {
    // 临时保存移除对象的所有数据(prev和next指针以及存储数据)
    final E element = x.item;
    final Node<E> next = x.next;
    final Node<E> prev = x.prev;
    //prev指针为null,则说明该对象为头节点
    if (prev == null) {
        first = next;
    } else {
        prev.next = next;
        x.prev = null;
    }
    //next指针为null,则说明该对象为尾节点
    if (next == null) {
        last = prev;
    } else {
        next.prev = prev;
        x.next = null;
    }

    x.item = null;
    size--;
    modCount++;
    return element;
}

同样理解任意一个核心方法,剩下两个方法也就不难理解了,我们以unlink(Node x)为例:

步骤1:执行remove操作前的数据结构
linkBefore1

步骤2:执行prev指针相关
linkBefore2

步骤3:执行next指针相关
linkBefore3

remove代码分析

//按index删除节点很简单,node方法获取到对应的元素,然后unlink删除即可
public E remove(int index) {
    checkElementIndex(index);
    return unlink(node(index));
}
//按对象删除,依次遍历链表,然后找到首个符合的元素,然后删除该元素
public boolean remove(Object o) {
    if (o == null) {
        for (Node<E> x = first; x != null; x = x.next) {
            if (x.item == null) {
                unlink(x);
                return true;
            }
        }
    } else {
        for (Node<E> x = first; x != null; x = x.next) {
            if (o.equals(x.item)) {
                unlink(x);
                return true;
            }
        }
    }
    return false;
}

//同样没啥好说的,移除第一个Node
public E removeFirst() {
    final Node<E> f = first;
    if (f == null)
        throw new NoSuchElementException();
    return unlinkFirst(f);
}
//移除最后一个Node
public E removeLast() {
    final Node<E> l = last;
    if (l == null)
        throw new NoSuchElementException();
    return unlinkLast(l);
}

node(int index)

我们来看一看node方法是如何找到对应index的元素节点的:

Node<E> node(int index) {
    if (index < (size >> 1)) {
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

可以看到,类似于二分查找法,第一次查找根据index判断是从头部还是尾部获取对应元素,相对于数组结构,性能还是有所欠缺。

小结

优点:

LinkedList没有大小限制

没有浪费存储空间(Node节点的创建需要额外消耗少量空间)

add,remove等操作的空间消耗是固定的,不会造成对元素进行额外的移动拷贝

缺点:

除了对首尾元素外,对其他节点,进行add,remove,set,get等操作,都需要进行遍历查找的,时间复杂度为O(n)

应用场景

查询操作少,存储大量数据,可以考虑使用LinkedList

多线程下:

LinkedList和ArrayList一样,都不是线程安全的。

在考虑线程安全的情况下,可以使用 ConcurrentLinkedQueue代替LinkedList,直接同步LinkedList对象,或者使用

List list = Collections.synchronizedList(new LinkedList(…));

对比ArrayList

ArrayList和LinkedList的大致区别如下:
* 1.ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。
* 2.对于随机访问get和set,ArrayList优于LinkedList,因为LinkedList要移动指针遍历查找。
* 3.对于新增和删除操作add和remove,LinedList比较占优势,因为ArrayList要移动数据。

当我们在集合中装5万条数据,测试运行结果如下:

比较

显然我们可以看出ArrayList更适合读取数据,linkedList更多的时候添加或删除数据。

ArrayList内部是使用可増长数组实现的,所以是用get和set方法是花费常数时间的,但是如果插入元素和删除元素,除非插入和删除的位置都在表末尾,否则代码开销会很大,因为里面需要数组的移动。
LinkedList是使用双链表实现的,所以get会非常消耗资源,除非位置离头部很近。但是插入和删除元素花费常数时间。

参考文档

http://www.fx114.net/qa-226-155160.aspx
http://www.cnblogs.com/huzi007/p/5550440.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值