java面试-java集合(下)

最新推荐文章于 2024-09-08 11:09:43 发布

编程岁月

最新推荐文章于 2024-09-08 11:09:43 发布

阅读量823

点赞数 14

分类专栏： java面试文章标签： java 面试哈希算法

本文链接：https://blog.csdn.net/qq_24018193/article/details/140235711

版权

7 篇文章 0 订阅

订阅专栏

一、hash冲突后，将元素放到链表头还是尾？

JDK1.7插入时采用头插法，多线程下，有链表闭环的bug。假设链表原来的元素是元素的顺序是C->B->A，此时线程1和2指向指向C，线程1和2.next指向B，当hashMap扩容并且线程2完成插入，此时链表的状态为A->B->C，此时线程1指向C，线程1.next指向B，此时线程1想要变量就变成C->B->C了，因为此时B.next->C
JDK1.8改成了尾插法，主要是为了减少线程安全的问题，转成红黑树后按照红黑树的规则来插了

为了减少哈希冲突发生的概率，当HashMap元素个数达到一个临界值threshold的时候，就会触发扩容，是一个相当耗时的操作。
扩容时机
- 第一次调用HashMap的put方法且数组为null时，会调用resize方法对table数组进行初始化，默认大小为16。
- 当hashMap元素个数大于扩容阈值threshold = 负载因子loadFactor(0.75) * 初始容量capacity(16)时。容量变为原来的2倍，先插入数据再扩容
容量范围：16-2^30个
加载因子过高，扩容频率变低，hash碰撞几率变大，查找时间长，但占用空间小，空间利用率变高
加载因子过低，扩容频率变高，hash碰撞几率变低，查找时间短，但占用空间大，空间利用率变低
扩容机制：扩容时，HashMap 会创建一个新的数组，其容量是原数组容量的两倍。然后将键值对放到新计算出的索引位置上。根据(e.hash & oldCap)是否为0，使得扩容后的位置=原位置 or 原位置 + 旧容量（原哈希值的高位中新增的那一位是否为1，因为位置计算实际上是保留低位值，去掉所有高位值，比如原容量16则保留4位低位，扩容后32为保留5位低位，相差1位，而这1位刚好是原容量16所在的位置，因此只需hash与原容量与操作得到最新的位是1还是0决定新元素的位置，上面的推论都得益于长度是2的倍数和hash的高低位运算）

优化了数据结构：在数组+链表的基础上改为数组+链表+红黑树
优化了链表插入的方式：jdk1.7是头插法，jdk1.8尾插法，主要是因为头插法有闭环的bug
优化了扩容的处理：jdk1.7需要重新执行hash函数重新放置数据的位置，而jdk1.8只需判断hash值与旧容量的与操作是否为0即可，为0则是原位置，否则就是原位置+旧容量
优化了扩容机制：jdk1.7的先判断是否需要扩容，再插入数据，jdk1.8则是先插入数据再扩容
优化了hash函数：jdk1.7经过4个移位和亦或，而jdk1.8只需高低16为亦或就行

jdk1.7在多线程下因为头插法形成闭环，因此扩容可能会死循环。
多线程put可能会导致元素的丢失。因为计算出来的位置可能会被其他线程的put覆盖，本来哈希冲突是应该用链表的，但多线程时由于没有加锁，相同位置的元素可能就被干掉了。
put和get并发时，可能导致get为null。线程1执行put时，因为元素个数超出阈值而导致出现扩容，线程2此时执行get，就有可能出现这个问题，因为线程1执行完table = newTab后，线程2中的table此时也发生了变化，此时去get时当然会get到null，因为元素还没有转移。

HashSet底层基于HashMap实现（除了clone()、writeObject()、readObject()是HashSet⾃⼰实现之外，其他⽅法都是直接调⽤HashMap中的⽅法。HashSet 会自动去重，因为HashMap 的键是唯一的（哈希值），相同键的值会覆盖掉原来的值，

ConcurrentHashMap线程安全；对整个桶数组进行了分割分段(Segment)，每一个分段上都用lock锁保护，ConCurrentHashMap不允许键值对null
HashMap线程不安全；HashMap的键值对允许有null

ConcurrentHashMap和Hashtable区别主要体现在实现线程安全的方式上不同。
底层数据结构： ConcurrentHashMap和hashMap一样。Hashtable和JDK1.7的HashMap一样
实现线程安全的方式：
- ConcurrentHashMap：（JDK1.7分段锁）对整个桶数组进行了分割分段(Segment)，每一把锁只锁容器其中一部分数据，多线程访问容器里不同数据段的数据，就不会存在锁竞争，提高并发访问率。（默认分配16个Segment） JDK1.8，使用 Node 数组+链表+红黑树的数据结构来实现，并发控制使用 synchronized 和 CAS 来操作。（JDK1.6以后对 synchronized锁做了很多优化） HashTable 在每次同步执行时都要锁住整个结构。 ConcurrentHashMap锁的方式是稍微细粒度的
- Hashtable(同一把锁) :使用synchronized保证线程安全，效率低下。当一个线程访问同步方法时，其他线程也访问同步方法，可能会进入阻塞或轮询状态