hashmap常见面试题

HashMap 和 Hashtable 的区别以及 HashMap 的 底层实现
这个是问的频率比较多的

  1. 线程是否安全: HashMap 是非线程安全的,HashTable 是线程安全
    的;HashTable 内部的方法基本都经过 synchronized 修饰。(如果你要
    保证线程安全的话就使用 ConcurrentHashMap 吧!);

  2. 效率: 因为线程安全的问题,HashMap 要比 HashTable 效率高一点。
    另外,HashTable 基本被淘汰,不要在代码中使用它;

  3. 对 Null key 和 Null value 的支持: HashMap 中,null 可以作为键,
    这样的键只有一个,可以有一个或多个键所对应的值为 null。。但是在
    HashTable 中 put 进的键值只要有一个 null,直接抛出
    NullPointerException。

  4. 初始容量大小和每次扩充容量大小的不同 : ①创建时如果不指定容量
    初始值,Hashtable 默认的初始大小为 11,之后每次扩充,容量变为原
    来的 2n+1。HashMap 默认的初始化大小为 16。之后每次扩充,容量
    变为原来的 2 倍。②创建时如果给定了容量初始值,那么 Hashtable 会
    直接使用你给定的大小,而 HashMap 会将其扩充为 2 的幂次方大小
    (HashMap 中的 tableSizeFor()方法保证,下面给出了源代码)。也就
    是说 HashMap 总是使用 2 的幂作为哈希表的大小,后面会介绍到为什么
    是 2 的幂次方。

  5. 底层数据结构: JDK1.8 以后的 HashMap 在解决哈希冲突时有了较大
    的变化,当链表长度大于阈值(默认为 8)时,将链表转化为红黑树,
    以减少搜索时间。Hashtable 没有这样的机制。
    HashMap 的底层实现
    JDK1.8 之前
    JDK1.8 之前 HashMap 底层是 数组和链表 结合在一起使用也就是 链表散列。
    HashMap 通过 key 的 hashCode 经过扰动函数处理过后得到 hash 值,然
    后通过 (n - 1) & hash 判断当前元素存放的位置(这里的 n 指的是数组的长
    度),如果当前位置存在元素的话,就判断该元素与要存入的元素的 hash 值
    以及 key 是否相同,如果相同的话,直接覆盖,不相同就通过拉链法解决冲 突。
    所谓扰动函数指的就是 HashMap 的 hash 方法。使用 hash 方法也就是扰
    动函数是为了防止一些实现比较差的 hashCode() 方法 换句话说使用扰动函 数之后可以减少碰撞。
    JDK 1.8 HashMap 的 hash 方法源码:
    JDK 1.8 的 hash 方法 相比于 JDK 1.7 hash 方法更加简化,但是原理不变。
    static final int hash(Object key) { int h; // key.hashCode():返回散列值也就是 hashcode // ^ :按位异或 // >>>:无符号右移,忽略符号位,空位都以 0 补齐 return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); } 对比一下 JDK1.7 的 HashMap 的 hash 方法源码.
    static int hash(int h) { // This function ensures that hashCodes that differ only by // constant multiples at each bit position have a bounded // number of collisions (approximately 8 at default load factor).

    h ^= (h >>> 20) ^ (h >>> 12); return h ^ (h >>> 7) ^ (h >>> 4); }
    相比于 JDK1.8 的 hash 方法 ,JDK 1.7 的 hash 方法的性能会稍差一点点,
    因为毕竟扰动了 4 次。
    所谓 “拉链法” 就是:将链表和数组相结合。也就是说创建一个链表数组,数组 中每一格就是一个链表。若遇到哈希冲突,则将冲突的值加到链表中即可。

JDK1.8 之后
相比于之前的版本, JDK1.8 之后在解决哈希冲突时有了较大的变化,当链表
长度大于阈值(默认为 8)时,将链表转化为红黑树,以减少搜索时间。

TreeMap、TreeSet 以及 JDK1.8 之后的 HashMap 底层都用到了红黑树。红黑
树就是为了解决二叉查找树的缺陷,因为二叉查找树在某些情况下会退化成一 个线性结构。

ConcurrentHashMap 和 Hashtable 的区别
ConcurrentHashMap 和 Hashtable 的区别主要体现在实现线程安全的方式上 不同。
• 底层数据结构: JDK1.7 的 ConcurrentHashMap 底层采用 分段的数组
+链表 实现,JDK1.8 采用的数据结构跟 HashMap1.8 的结构一样,数组
+链表/红黑二叉树。Hashtable 和 JDK1.8 之前的 HashMap 的底层数
据结构类似都是采用 数组+链表 的形式,数组是 HashMap 的主体,链 表则是主要为了解决哈希冲突而存在的;
• 实现线程安全的方式(重要): ① 在 JDK1.7 的时候,
ConcurrentHashMap(分段锁) 对整个桶数组进行了分割分段
(Segment),每一把锁只锁容器其中一部分数据,多线程访问容器里不同
数据段的数据,就不会存在锁竞争,提高并发访问率。 到了 JDK1.8 的
时候已经摒弃了 Segment 的概念,而是直接用 Node 数组+链表+红
黑树的数据结构来实现,并发控制使用 synchronized 和 CAS 来操
作。(JDK1.6 以后 对 synchronized 锁做了很多优化) 整个看起来就
像是优化过且线程安全的 HashMap,虽然在 JDK1.8 中还能看到
Segment 的数据结构,但是已经简化了属性,只是为了兼容旧版本;
② Hashtable(同一把锁) :使用 synchronized 来保证线程安全,效率非
常低下。当一个线程访问同步方法时,其他线程也访问同步方法,可能 会进入阻塞或轮询状态,如使用 put 添加元素,另一个线程不能使用
put 添加元素,也不能使用 get,竞争会越来越激烈效率越低。
HashMap 的长度为什么是 2 的幂次方
为了能让 HashMap 存取高效,尽量较少碰撞,也就是要尽量把数据分配均
匀。我们上面也讲到了过了,Hash 值的范围值-2147483648 到 2147483647,
前后加起来大概 40 亿的映射空间,只要哈希函数映射得比较均匀松散,一般应
用是很难出现碰撞的。但问题是一个 40 亿长度的数组,内存是放不下的。所以
这个散列值是不能直接拿来用的。用之前还要先做对数组的长度取模运算,得 到的余数才能用来要存放的位置也就是对应的数组下标。这个数组下标的计算
方法是“ (n - 1) & hash”。(n 代表数组长度)。这也就解释了 HashMap 的长
度为什么是 2 的幂次方。 这个算法应该如何设计呢?
我们首先可能会想到采用%取余的操作来实现。但是,重点来了:“取余(%)操
作中如果除数是 2 的幂次则等价于与其除数减一的与(&)操作(也就是说
hash%length==hash&(length-1)的前提是 length 是 2 的 n 次
方;)。” 并且 采用二进制位操作 &,相对于%能够提高运算效率,这就解释
了 HashMap 的长度为什么是 2 的幂次方。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值