ArrayList
基本知识
ArrayList相当于动态数组,其底层是数组队列,能实现动态增加长度,在大量添加元素时,使用ensureCapacity操作来增加其容量。
其实现了List接口,表明其是列表,支持增删改查操作和使用下标进行读取;实现了RandomAccess接口,可实现随机访问;实现了Cloneable接口,表明其具有拷贝功能;实现了Serializable接口,表明它可以进行序列化操作,也就是可以将对象转换为字节流进行持久化存储或网络传输,其继承和调用接口的关系图如下:
与Vector的异同
两者的底层都使用object[]数组存储,但Vector线程安全,其使用了synchronized关键字进行同步处理,ArrayList线程不安全。
与LinkedList的异同
线程安全性:两者都不保证线程安全。
底层数据结构:ArrayList底层使用Object数组,LinkedList底层采用双向队列。
插入和删除:ArrayList在末尾插入或删除元素时,时间复杂度为O(1),而在指定位置插入或删除时,时间复杂度为O(n),因为涉及到大量移动元素。LinkedList在头尾插入或删除元素时,时间复杂度为O(1),在指定位置插入或删除元素时,时间复杂度为O(n),因为需要将元素移动到指定位置。
是否支持随机访问:ArrayList支持,LinkedList不支持。
内存占用情况:ArrayList的空间浪费主要体现在在list列表的结尾会预留一定的容量空间,而 LinkedList 的空间花费则体现在它的每一个元素都需要消耗比 ArrayList 更多的空间,因为要存放直接后继和直接前驱以及数据。
ArrayList扩容
ArrayList 每次扩容之后容量都会变为原来的1.5倍左右,源代码如下:
/**
* 要分配的最大数组大小
*/
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
/**
* ArrayList扩容的核心方法。
*/
private void grow(int minCapacity) {
// oldCapacity为旧容量,newCapacity为新容量
int oldCapacity = elementData.length;
// 将oldCapacity 右移一位,其效果相当于oldCapacity /2,
// 我们知道位运算的速度远远快于整除运算,整句运算式的结果就是将新容量更新为旧容量的1.5倍,
int newCapacity = oldCapacity + (oldCapacity >> 1);
// 然后检查新容量是否大于最小需要容量,若还是小于最小需要容量,那么就把最小需要容量当作数组的新容量,
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
// 如果新容量大于 MAX_ARRAY_SIZE,进入(执行) `hugeCapacity()` 方法来比较 minCapacity 和 MAX_ARRAY_SIZE,
// 如果minCapacity大于最大容量,则新容量则为`Integer.MAX_VALUE`,否则,新容量大小则为 MAX_ARRAY_SIZE 即为 `Integer.MAX_VALUE - 8`。
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
Set
Comparable 和 Comparator 的异同
两者都可用于对指定数据进行排序,其中Comparable来自java.lang包,compareTo(Object obj)用于实现排序;Comparator来自java.util包,compare(Object obj1, Object obj2)用于实现排序,若要实现自定义排序,则需要重写compareTo或compare方法,自定义的排序实现实例如下(可用于数组、集合排序,对于优先队列的创建,也可通过重写的方式自定义排序方法):
Collections.sort(arrayList, new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
return o2.compareTo(o1);
}
});
无序性和不可重复性
无序性是指存储的数据在底层数组中并非按照数组索引的顺序添加 ,而是根据数据的哈希值决定的;不可重复性是指添加的元素按照 equals() 判断时,返回 false,需要同时重写equals()方法和hashCode()方法。
HashSet、LinkedHashSet 和 TreeSet 三者的异同
1、三者是set的实现类,都能保证元素位移,但不支持线程安全;
2、HashSet 的底层数据结构是哈希表;LinkedHashSet 的底层数据结构是链表和哈希表,元素的插入和取出顺序满足FIFO;TreeSet底层数据结构是红黑树,元素是有序的,排序的方式有自然排序和定制排序。
3、HashSet用于不需要保证元素插入和取出顺序的场景,LinkedHashSet用于保证元素的插入和取出顺序满足FIFO的场景,TreeSet用于支持对元素自定义排序规则的场景(通过重写compareTo或compare方法)。