加载因子为什么是0.75
hash冲突怎么解决
线性探测再散列 dii=1,2,3,…,m-1 这种方法的特点是:冲突发生时,顺序查看表中下一单元,直到找出一个空单元或查遍全表。
二次探测再散列 di=12,-12,22,-22,…,k2,-k2 ( k<=m/2 ) 这种方法的特点是:冲突发生时,在表的左右进行跳跃式探测,比较灵活。
伪随机探测再散列 di=伪随机数序列。 具体实现时,应建立一个伪随机数发生器,(如i=(i+p) % m),并给定一个随机数做起点。
链地址法 就是当发生hash冲突的时候,就使用一个链表来存放这些值。也就是将hash算法得到的值相同的key对应的value放在一个链表中。 Java中的hashmap中就是使用了这个方法。
hashmap容量为什么是2的幂次
Hash算法的均匀分布,减少哈希碰撞几率:16或者其他2的幂,Length-1的值是后面的二进制位全为1,例如16-1=15二进制1111,32-1=31二进制11111,这种情况下,index = hash&(length-1),hash是指key的hashcode前16位和后16位做异或运算得到的值(目的还是使每一位都参与了运算,减少哈希碰撞),index的结果等同于key值的hash后几位的值。只要输入的HashCode本身分布均匀,Hash算法的结果就是均匀的。
为什么定义hashmap初始容量时,如果不为2的幂次,初始容量则自动设为比自定义容量大的第一个2的幂次
假如设为7,则初始容量自动设为2^3 = 8
原因在于tableSizeFor这个方法,通过位运算,最终能把不是2的幂次的初始容量转换为大于它最近的2的幂次容量。
hashtable和hashmap的区别
hashtable许多方法使用了synchronized关键字来保证线程安全,截图中只是其中一个
hashtable计算数组下标时,用了大量%,效率不如hashmap的位运算好
hashmap计算index时,是采用(n - 1) & hash,这个位运算等同于对数组长度取模