Java集合主要由两个接口派生而出:Collection和Map
而这主要的集合又大致分为:Map,List,Set,Queue
集合和数组的区别
1.数组长度必须在初始化时指定,只能保存定长数据;集合则可以保存数量不定的数据
2.数组元素可以是基本类型的值,也可以是对象;集合则只能保存对象,基本类型的变量要转换成对应的包装类才能放入集合中(如:int -> Integer)
几种主要集合的基本特征
其中Set表示无序不重复的集合
List表示有序、可重复的集合
Map表示有映射关系的集合
Map和Set、List的关系:Map里的所有Key可以看做一个Set集合(没有顺序,不重复)
Map里的所有value可以看做一个List集合,元素之间可以重复
Queue模拟的是队列这种数据结构
在上面poll和remove的区别是如果队列为空poll会返回null,而remove则会抛出异常
一、ArrayList:
概述:以数组的形式实现,节约空间,前面提到数组的大小是固定的,它也不例外,其默认大小是10。
-
Add():
因为我们存放内容的大小不可能永远≤10,所以引出了ArrayList的自动扩容机制
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
查看源码我们可以发现它的实现核心就是ensureCapacityInternal,而这个函数也就是自动扩容的核心
自动扩容的具体实现:
private void ensureCapacityInternal(int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
//如果当前所需大小大于之前的数组长度则调用grow方法将所需大小传入进行扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
// 扩展为原来的1.5倍,为什么是1.5倍?
//“>>”"<<"是右移左移运算符,会把二进制数向右向左进行移动
//例:1<<4 即 0001->1000 相当于1*2的4次方,右移同理
int newCapacity = oldCapacity + (oldCapacity >> 1);
// 如果扩为1.5倍还不满足需求,直接扩为需求值
//这种情况只会在addAll的时候出现
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
//扩容后调用copyof来移动受影响的元素,完成新数组的构建
elementData = Arrays.copyOf(elementData, newCapacity);
}
-
附:addAll():
public boolean addAll(Collection<? extends E> c) {
Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew); // Increments modCount
System.arraycopy(a, 0, elementData, size, numNew);
size += numNew;
return numNew != 0;
}
-
remove():
public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
-
get()、set():
public E set(int index, E e) {
rangeCheck(index);
checkForComodification();
E oldValue = ArrayList.this.elementData(offset + index);
ArrayList.this.elementData[offset + index] = e;
return oldValue;
}
public E get(int index) {
rangeCheck(index);
checkForComodification();
return ArrayList.this.elementData(offset + index);
}
二、LinkedList:
概述:基于链表的实现,双向链表使用更多空间,还需要额外的链表指针操作
-
get()、set():
public E set(int index, E element) {
checkElementIndex(index);
Node<E> x = node(index);
E oldVal = x.item;
x.item = element;
return oldVal;
}
public E get(int index) {
checkElementIndex(index);
return node(index).item;
}
可以发现两个函数都调用了node函数,node函数会以O(n/2)的性能去获取一个节点,我们去看下node函数,为什么性能是O(n/2)
Node<E> node(int index) {
// assert isElementIndex(index);
if (index < (size >> 1)) {
Node<E> x = first;
for (int i = 0; i < index; i++)
x = x.next;
return x;
} else {
Node<E> x = last;
for (int i = size - 1; i > index; i--)
x = x.prev;
return x;
}
}
查看node源码我们可以发现它会首先判断index是在前半区间还是后半区间,如果在前半区间就从head搜索,而在后半区间就从tail搜索。而不是一直从头到尾的搜索。如此设计,就将节点访问的复杂度由O(n)变为O(n/2)。
未完待续。。。