在阿里巴巴Java开发手册中,阿里工程师对于初始化hashmap的容量的建议是:
在jdk中,当我们new hashmap并且指定初始化容量capacity时,jdk会帮我们取第一个大于或等于capacity的2次幂。
具体的实现是:
1.先把capacity - 1 // 减一 就是为了保证capacity=16,还能返回16.
2.进行多次无符号右移和或运算
3.最后 + 1
比如,我们new HashMap(3),会生成一个4容量的map,5->8。10->16,4->4,16->16。
但是,hashmap在我们存放的数据大于初始化容量*负载因子(默认0.75)时就会自动扩容,自动扩容是非常消耗性能的。因为元素要重新hash分配。注意大于阈值才会扩容,等于的时候不会扩容。
那么当我们生成了一个7容量的map,jdk会生成一个8容量的map,那么存放到8 * 0.75 = 6个元素时就会扩容了,跟我们预想放7个有偏差,所以阿里就推出了这个建议。
initialCapacity = (int) ((float) expectedSize / 0.75F + 1.0F)
初始化时只要在(int) ((float) expectedSize / 0.75F + 1.0F) ~ 大于它的2次幂都可以。
这样我们想放7个元素,就设置 7 / 0.75 + 1 = 10,10-16之间都一样。因为经过jdk都会生成16的容量,这样我们存放7个元素就不会因为扩容而损失性能了,当然会消耗一部分内存。