一、ArrayList底层
1、ArrayList扩容规则
ArrayList的初始容量为空,从源代码可以得出无参构造是0容量
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
如果参数是整数,则创建长度为传参的大小
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
如果是集合,则根据集合大小创建
public ArrayList(Collection<? extends E> c) {
Object[] a = c.toArray();
if ((size = a.length) != 0) {
if (c.getClass() == ArrayList.class) {
elementData = a;
} else {
elementData = Arrays.copyOf(a, size, Object[].class);
}
} else {
// replace with empty array.
elementData = EMPTY_ELEMENTDATA;
}
}
当插入第一个元素,ArrayList会发生第一次扩容会变为10。当存满元素后,再插入一个元素,就会触发第二次扩容,会创建一个长度为上次容量的1.5倍数组,旧数组元素拷贝到新数组,再存入元素,原数组丢弃。
细节:虽然说是1.5倍,但是比如长度为15,那1.5倍就是22.5不是整数,但是底层不是用乘法得出新数组长度,底层处理方式:15>>1=7,7+15=22
前20次扩容长度 :
小疑问:如果我在创建ArrayList时通过addAll()函数传入的是11个元素的list数组,那么他的长度是15还是11呢?
答案:你是不是以为他就是按照扩容规则数组容量是15?答案是11,这涉及到了我们addAll的一个规则,当他发现原始容量不够时,他会在我们下次扩容容量大小和元素之间取一个最大值,max[10,11]=11,这只是addAll,add函数还是遵循上图规则。
二、iterator的fail-fast和fail-safe机制
1、fail-fast演示
加断点,在他打印到C的时候停下
debug模拟另一个线程,加入一个新元素
出现了并发修改异常
2、fail-safe演示
他用的是CopyWriteArrayList数组对象
依旧重复上一个演示断点debug,模拟一个线程进行添加一个元素,发现仍然可以正常打印,但是打印的是旧数组。
3、fail-fast源码分析
arraylist会比对迭代器一开始记录修改的次数跟检测时list修改次数对比,如果次数不一样,则抛出异常
4、fail-safe源码分析
snapshot一开始记录下遍历的数组,他每次调用add方法,都会getArray拿到原来的数组,然后将原来数组复制一份,新增的元素加载了这个复制品,但是遍历的还是旧数组,遍历完成旧数组丢弃。
三、LinkedList和ArrayList比较
1、ArrayList是连续的内存,LinkedList是不连续的内存。则ArrayList如果知道第一个元素的内存地址,就可以迅速计算出其余元素的地址。LinkedList是要知道起始地址,起始地址无法计算其他地址,只能一个一个获取。所以ArrayList随机访问性高
2、ArrayList增删慢,查询快。LinkedList增删快,查询慢。以上这两句话是不严谨的,首先查询,查询的话,是查询内容,随机访问的只是索引值,两者不能等价。arraylist尾部插入快、删除性能可以,其他部分插入,删除都会移动数据,性能低。LinkedList头尾插入删除性能高。
3、ArrayList可以使用cpu缓存。这里涉及到了一个局部性原理,例如以下这张图,a+b运算,首先cpu要读取a和b,再将结果写回c,那cpu计算是纳秒级别的,但是等待数据读写时间是成百倍,所以不能让cpu直接读取内存,要让cpu读取从内存放入缓存的数据。那么cpu中有一个假设,你读取一个数据的时候,其相邻数据也大概率会被读到,所以会一次性将其相邻的读进来,这就是局部性原理。但是对于链表,不是连续内存,他们有的相邻过远,并不能放入缓存,况且cpu缓存容量有限。