集合初始化时, 指定集合初始值大小
【阿里巴巴手册推荐】
集合初始化时, 指定集合初始值大小。
说明: HashMap 使用 HashMap(int initialCapacity) 初始化,
正例:initialCapacity = (需要存储的元素个数 / 负载因子) + 1。注意负载因子 ( 即 loader
factor) 默认为 0.75, 如果暂时无法确定初始值大小, 请设置为 16。
反例: HashMap 需要放置 1024 个元素, 由于没有设置容量初始大小,随着元素不断增加,容量 7 次被迫扩大, resize 需要重建 hash 表,严重影响性能。
先举个例子来看看:
package com.song.list;
import java.util.HashMap;
import java.util.Map;
public class HashMapDemo {
public static void main(String[] args) {
//循环 1亿次
for (int num = 1; num <= 1000000000; num = num * 10) {
int capacity = (int) (num / 0.75 + 1);
String test = "test";
System.out.println("num is " + num);
Map<Integer, String> map = new HashMap<>();
Map<Integer, String> mapCapacity = new HashMap<>(capacity);
long strat1 = System.nanoTime();
for (int i = 0; i < num; i++) {
map.put(i, test);
}
long end1 = System.nanoTime();
System.out.println("没设置初始值的map: " + (end1 - strat1) + " capacity: " + "null");
long strat2 = System.nanoTime();
for (int i = 0; i < num; i++) {
mapCapacity.put(i, test);
}
long end2 = System.nanoTime();
System.out.println("设置了初始值的map: " + (end2 - strat2) + " capacity: " + capacity);
System.out.println("*****************************************************************");
}
}
}
日志输出:
从结果上可以看出,绝大多数数据还时有比较明显的性能上的提升,但是个别数据,如图中红色框标记的数据,单从耗时上来说甚至比没有设置的初始值还多,这是什么原因呢?
这是因为HashMap有扩容机制,当达到扩容条件时会进行扩容。HashMap的扩容条件就是当HashMap中的元素个数(size)超过临界值(threshold)时就会自动扩容。在HashMap中threshold=loadFactory * capacity。
所以,如果我们没有设置初始容量的大小,随着元素的不断增加,HashMap会发生多次扩容,而HashMap中的扩容机制决定了每次扩容都需要重建hash表,这是非常影响性能的。