Hashmap
数据结构
- 1.7:数组+链表
- 1.8: 数组+链表/红黑树
- 链表>8,数组总长度>64,链表就转换成红黑树
- 如果链表很长,查询效率低
- 为什么用红黑树?
- 红黑树相比平衡树检索效率差不多,但是对于插入删除等操作,效率高很多。红黑树省去了很多没必要的平衡操作。
hash碰撞
- key-value形式存储,大量哈希值一样,此时查找的效率就会被大大减慢
- 当哈希值增多到服务器短时间内处理不过来时,服务器会因此处于忙碌状态并且不断的被消耗网络资源和系统资源,这就是DOS拒绝服务。
扩容(减少扩容)
- addEntry方法第一步便是判断当前map集合是否超过了最大容量,最大容量=初始容量x负载因子(默认为0.75)。超过的话就需要先执行resize方法进行扩容,扩容的大小为原大小的2倍。
- Resize的性能非常低,因此建议new hashmap就分配合适的初始容量,减少扩容的频率~
Hashmap:put方法的逻辑
- 如果hashmap未被初始化过,则初始化
- 对key求hash值,然后再计算下标
- 如果没有碰撞,直接放入桶中,如果hash碰撞了,则以链表的方式链接到后面
- 如果链表长度>8,并数组总长度>64,则将链表转成红黑树。如果链表长度低于阀值,则再转回链表
- 如果节点已存在,就替换旧值
- 如果桶满了(最大容量=初始容量x负载因子(默认为0.75)),就执行resize方法扩容。
ConcurrentHashmap
出现原因:普通的hash不安全
数据结构:
- 1.7采用数组+segment(分段锁)
- 拥有一个Entry数组,数组中的每个元素又是一个链表
- 坏处
- 过程更加繁琐
- 好处
- 写操作只对segment加锁,不会影响其他segment,提升了并发能力
- 1.8采用数组+链表/红黑树
- 看起来差不多,但底层用了很多CAS
CAS(比较再交换)
- 为了保证合理操作JMM,禁止指令重排。使用了volatile关键字,
- 此关键字禁止指令重排,并保证了可见性。但是volatile没有办法保证操作的原子性,如i++操作
- 故使用CAS,内存中修改数据后会刷新到主存中,CAS机制是在刷新前确认一件事:主存中的内容是不是和最开始拷贝给工作内存的内容一样,这叫比较。如果一样,则把工作内存更新后的值赋给主存
- 但是CAS会造成ABA问题,此时需要加乐观锁来解决
- 给一个version字段,比的不再是值而是“值+stemp。”
hashtable和hashmap的区别
- HashTable的父类是Dictionnary,HashMap的父类是AbstractMap
- HashTable里所有的方法都加了synchronized,所以HashTable是线程安全的,而HashMap是线程不安全的
- HashTable计算哈希值直接对数组长度取余,HashMap是通过容量-1“与上”下标对应的哈希值
- HashTable是在构造方法中对容量进行初始化默认为11,HashMap是在put时对容量进行初始化默认为16
Arraylist和Linkedlist
- Arraylist的底层用数组实现,因为arraylist是由顺序表实现的,所以在进行增删改操作时要挪位置,查询快,增删慢
- Linkedlist底层用链表来实现,链表根据指针逐一循环查找,所以查找效率低;当它删除时,只需要把链断开,再连接上,所以删除效率高。