Collection
List
List继承于Collection接口,相对于Set,允许存在重复元素。
ArrayList
ArrayList底层实现是基于一维数组,在查找方面时间复杂度为O(1)。在添加元素过程中会检查元素长度是否需要扩容,如果需要扩容,判断大小是否超过MAX_INTEGER-8,否则扩大1.5倍。
在扩容过程中,是申请一个新的数组,并把旧的数组值挪动到前者。
扩展:在不挪动数组的情况下,如何实现头部插入元素(循环队列)
补充:System.arraycopy(elementData, 0, a, 0, size);底层CPU直接对块进行操作,增删速度加快
LinkedList
LinkedList底层实现基于链表(双向链表),在少量数据的时候插入和删除的速度较快,但是对于数据量较大时,因为删除和添加仍然需要一个遍历过程,所以仍然需要耗时一定时间。
LinkedList除了实现List接口,还实现了Deque,存有队列的性质。
扩展:如何选择ArrayList和LinkedList(考虑元素修改频率、修改常发生的位置等…)
Vector
Vector线程安全的ArrayList,添加synchronized关键字实现同步,锁的是整个对象、代价太高,导致效率低下。
扩容:容量 = 旧 * 2
Set
不允许元素重复,无序(个人理解,有序是指在有索引的情况下快速定位到指定元素上)。
HashSet
HashSet通过HashMap实现,查找速度O(1),但是元素无序,本质上将元素值作为hashMap的key
TreeSet
TreeSet中的查找速度为O(logN)
Map
HashMap
HashMap底层通过数组+链表/红黑树实现,存放的元素是内部的实现类Entry
- 初始化
HashMap有4种构造方法,常用的有无参、负载因子、负载因子+初始化长度,在构造方法种只负责初始化负载因子和长度。 - loadFactory
loadFactory设置为0.75:目的是为了减少哈希冲突,提高效率。当loadFactory=1时,增加了哈希冲突的可能性,虽然节省了空间,但查找效率降低。
当loadFactory=0.5时,虽然减少了哈希冲突,但却占用了大部分空间。 - hash()
hash ^ hash>>>16 是为了将key.hashcode()的高16位参与到计算当中,提高计算得出结果的随机性,减少哈希冲突。 - (n-1) & hash
前提是n的值总是2 的指数倍,意义也是在于使哈希分布更加散列均匀,hash&(n-1)等价于我们的取余操作,位运算的效率要更高。 - 什么时候转成红黑树:
数组长度大于64且链表长度大于8时 - modCount的作用:
记录HashMap的修改记录,当处于多线程环境中如果modCount记录出错,将会抛出CocurrentModificationException问题,对于非迭代器遍历修改集合也会出现该问题。
HashTable
加了synchronized的hashMap