学习动机
Java Collection库中有三类:List,Queue,Set;而List接口,有三个子实现类:ArrayList,Vector,LinkedList。
LinkedList采用的双向链表结构,和ArrayList的数组结构不同,链表结构的优势就是便于大量的数据添加和删除,但对于ArrayList擅长的数据查询则并非擅长。
本文进行LinkedList源码的分析。
构造&成员属性
成员变量
//容器的size
transient int size = 0;
//类似于指针,记录着链表的第一个数据
transient Node<E> first;
//连边的最后一个数据
transient Node<E> last;
看一下Node的内部:
private static class Node<E> {
E item;//存储的数据
Node<E> next;//指向链表的下一个数据
Node<E> prev;//链表的前一个数据
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
我们可以看到,LinkedList的内部实际上是有若干个相连的Node节点组成的,每个Node节点都包含着该节点的数据、前一个节点、后一个节点。、
构造方法如下:
public LinkedList() {
}
public LinkedList(Collection<? extends E> c) {
this();
addAll(c);
}
构造方法很简单,第二个构造中传入了一个Collection集合,也只是执行了addAll(c)方法。
add()方法分析
准备
照常理我们要尝试分析add()相关方法了,在这之前我们先看一下几个核心的元素插入方法:
private void linkFirst(E e)
void linkLast(E e)
void linkBefore(E e, Node succ)
//将数据作为FirstNode插入链表
private void linkFirst(E e) {
//取得链表第一个元素
final Node<E> f = first;
//初始化数据,新建一个Node对象,该对象中数据为要插入的新数据
//同时,该数据的前一个节点为null(当然因为它是首个节点)
//该数据的后一个节点为之前的first节点
final Node<E> newNode = new Node<>(null, e, f);
first = newNode;
if (f == null)
//如果之前的首个节点(现在应该是第二个)为空,说明执行该插入操作前,链表为空
//新节点既是首节点,也是尾节点(因为现在链表元素size = 1)
last = newNode;
else
//否则说明之前不是空链表
//之前的首个节点的前一个节点变成新的首节点
f.prev = newNode;
size++;
modCount++;
}
//将数据作为LastNode插入链表
void linkLast(E e) {
final Node<E> l = last;
final Node<E> newNode = new Node<>(l, e, null);
last = newNode;
if (l == null)
first = newNode;
else
l.next = newNode;
size++;
modCount++;
}
//将数据插入到某个链表节点之前
void linkBefore(E e, Node<E> succ) {
// assert succ != null;
final Node<E> pred = succ.prev;
final Node<E> newNode = new Node<>(pred, e, succ);
succ.prev = newNode;
if (pred == null)
first = newNode;
else
pred.next = newNode;
size++;
modCount++;
}
理解任意一个核心方法,剩下两个方法也就不难理解了,我们以linkBefore为例:
步骤1:执行linkBefore时,LinkedList的数据结构
步骤2:执行final Node newNode = new Node<>(pred, e, succ);
步骤3:执行pred.next = newNode;
add()方法
public boolean add(E e) {
//其实只是执行linkLast方法将数据添加到链表末尾
linkLast(e);
return true;
}
public void add(int index, E element) {
checkPositionIndex(index);
//将元素插入,也是执行了linklast或linkBefore方法
if (index == size)
linkLast(element);
else
linkBefore(element, node(index));
}
//将Collection中元素插入LinkedList最后
public boolean addAll(Collection<? extends E> c) {
//如果我们在构造中传入一个Collection,实际会走下面的代码
return addAll(size, c);
}
//将Collection中元素插入LinkedList指定index
public boolean addAll(int index, Collection<? extends E> c) {
checkPositionIndex(index);//检查是否越界,若越界抛出IndexOutOfBoundsException异常
//先将集合转化为数组
Object[] a = c.toArray();
int numNew = a.length;
//如果数组为空,返回false,方法执行结束
if (numNew == 0)
return false;
Node<E> pred, succ;
if (index == size) {
//说明是通过构造初始化链表,此时链表中数据为空
succ = null;//succ: 索引位置从指定集合插入的第一个元素
pred = last;//pred: 插入数组的第一个元素节点
} else {
//node(index)方法是获取对应index的Node对象
succ = node(index);
pred = succ.prev;
}
//将数组中元素转换为一个链表,pred永远代表第一个Node节点
for (Object o : a) {
@SuppressWarnings("unchecked") E e = (E) o;
Node<E> newNode = new Node<>(pred, e, null);
if (pred == null)
first = newNode;
else
pred.next = newNode;
pred = newNode;
}
//将新的链表插入原有链表
if (succ == null) {
last = pred;
} else {
pred.next = succ;
succ.prev = pred;
}
//size修改,修改次数modCount++
size += numNew;
modCount++;
return true;
}
add相关方法基本就这些,当然还有两个简单的,特此列出,不赘述:
public void addFirst(E e) {
linkFirst(e);
}
public void addLast(E e) {
linkLast(e);
}
remove代码分析
先看一下remove相关的核心方法:
//删除第一个节点
private E unlinkFirst(Node<E> f) {
final E element = f.item;
final Node<E> next = f.next;
f.item = null;
f.next = null; // help GC
first = next;
if (next == null)
last = null;
else
next.prev = null;
size--;
modCount++;
return element;
}
//删除last节点
private E unlinkLast(Node<E> l) {
final E element = l.item;
final Node<E> prev = l.prev;
l.item = null;
l.prev = null; // help GC
last = prev;
if (prev == null)
first = null;
else
prev.next = null;
size--;
modCount++;
return element;
}
//删除某个节点
E unlink(Node<E> x) {
// 临时保存移除对象的所有数据(prev和next指针以及存储数据)
final E element = x.item;
final Node<E> next = x.next;
final Node<E> prev = x.prev;
//prev指针为null,则说明该对象为头节点
if (prev == null) {
first = next;
} else {
prev.next = next;
x.prev = null;
}
//next指针为null,则说明该对象为尾节点
if (next == null) {
last = prev;
} else {
next.prev = prev;
x.next = null;
}
x.item = null;
size--;
modCount++;
return element;
}
同样理解任意一个核心方法,剩下两个方法也就不难理解了,我们以unlink(Node x)为例:
步骤1:执行remove操作前的数据结构
步骤2:执行prev指针相关
步骤3:执行next指针相关
remove代码分析
//按index删除节点很简单,node方法获取到对应的元素,然后unlink删除即可
public E remove(int index) {
checkElementIndex(index);
return unlink(node(index));
}
//按对象删除,依次遍历链表,然后找到首个符合的元素,然后删除该元素
public boolean remove(Object o) {
if (o == null) {
for (Node<E> x = first; x != null; x = x.next) {
if (x.item == null) {
unlink(x);
return true;
}
}
} else {
for (Node<E> x = first; x != null; x = x.next) {
if (o.equals(x.item)) {
unlink(x);
return true;
}
}
}
return false;
}
//同样没啥好说的,移除第一个Node
public E removeFirst() {
final Node<E> f = first;
if (f == null)
throw new NoSuchElementException();
return unlinkFirst(f);
}
//移除最后一个Node
public E removeLast() {
final Node<E> l = last;
if (l == null)
throw new NoSuchElementException();
return unlinkLast(l);
}
node(int index)
我们来看一看node方法是如何找到对应index的元素节点的:
Node<E> node(int index) {
if (index < (size >> 1)) {
Node<E> x = first;
for (int i = 0; i < index; i++)
x = x.next;
return x;
} else {
Node<E> x = last;
for (int i = size - 1; i > index; i--)
x = x.prev;
return x;
}
}
可以看到,类似于二分查找法,第一次查找根据index判断是从头部还是尾部获取对应元素,相对于数组结构,性能还是有所欠缺。
小结
优点:
LinkedList没有大小限制
没有浪费存储空间(Node节点的创建需要额外消耗少量空间)
add,remove等操作的空间消耗是固定的,不会造成对元素进行额外的移动拷贝
缺点:
除了对首尾元素外,对其他节点,进行add,remove,set,get等操作,都需要进行遍历查找的,时间复杂度为O(n)
应用场景
查询操作少,存储大量数据,可以考虑使用LinkedList
多线程下:
LinkedList和ArrayList一样,都不是线程安全的。
在考虑线程安全的情况下,可以使用 ConcurrentLinkedQueue代替LinkedList,直接同步LinkedList对象,或者使用
List list = Collections.synchronizedList(new LinkedList(…));
对比ArrayList
ArrayList和LinkedList的大致区别如下:
* 1.ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。
* 2.对于随机访问get和set,ArrayList优于LinkedList,因为LinkedList要移动指针遍历查找。
* 3.对于新增和删除操作add和remove,LinedList比较占优势,因为ArrayList要移动数据。
当我们在集合中装5万条数据,测试运行结果如下:
显然我们可以看出ArrayList更适合读取数据,linkedList更多的时候添加或删除数据。
ArrayList内部是使用可増长数组实现的,所以是用get和set方法是花费常数时间的,但是如果插入元素和删除元素,除非插入和删除的位置都在表末尾,否则代码开销会很大,因为里面需要数组的移动。
LinkedList是使用双链表实现的,所以get会非常消耗资源,除非位置离头部很近。但是插入和删除元素花费常数时间。
参考文档
http://www.fx114.net/qa-226-155160.aspx
http://www.cnblogs.com/huzi007/p/5550440.html