HashMap
中getOrDefault()
性能如何?
引言
笔者经常看到这样的代码:
int total = 0; if (frequency.containsKey(k)) { total += frequency.get(k); }
不理解,为什么不直接一行代码搞定,并且减少一次哈希表的查询:
int total = 0; total += frequency.getOrDefault(k, 0);
看多了,甚至开始怀疑,后一种写法是否真的比前一性能种好(哪怕看起来是显然的),于是进行验证。
正文
从JDK1.8
开始,Map
接口中增加了default
方法getOrDefault(Object key, V defaultValue)
。`
HashMap
中进行了方法重写:
@Override
public V getOrDefault(Object key, V defaultValue) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? defaultValue : e.value;
}
显然这是一个便捷方法,方法中进行了一次哈希表的查询操作。JDK提供这个方法之前,需要这样写:
int total = 0;
Integer v = frequency.get(k);
if(v != null) {
total += v;
}
性能比较
上述3中写法的性能各自如何?拿实测说话。
-
map中存放了200W以内的偶数作为key,value都是0;
-
每个测试方法中运行200W次的查询。其中100W次key为偶数,查询命中;另一半未命中。
-
多次运行结果都差不多(结果ms):
timeTaken01: 58 //1、getOrDefault方式 timeTaken02: 168 //2、先containsKey判断,key存在再get timeTaken03: 32 //3、直接get,get结尾不为null才累加进结果
结论
建议采用get()
和getOrDefault()
,不用containsKey()再get()
的方式。
getOrDefault
性能其实和直接get
差不了太多,为了便捷性完全可以接受;- 先
containsKey
判断,key
存在再get
这种方式,根本没必要!(相当于查询2次,性能差) - 直接get,性能最好。(性能比
getOrDefault
好的原因,主要是:如果get得到的结果为null,就跳过,不再执行加法;而getOrDefault无论如何都要执行累加操作)
测试代码
static final int N = 2000000;
static Map<Integer, Integer> map = new HashMap<>();
static {
for (int i = 0; i < N; i+=2) {
map.put(i, 0);
}
}
public static void testPerformance() {
final long t1 = System.currentTimeMillis();
test01();
final long t2 = System.currentTimeMillis();
test02();
final long t3 = System.currentTimeMillis();
test03();
final long t4 = System.currentTimeMillis();
System.out.println("timeTaken01: " + (t2-t1));
System.out.println("timeTaken02: " + (t3-t2));
System.out.println("timeTaken03: " + (t4-t3));
}
public static void test01() {
int ans = 0;
for (int i = 0; i < N; i++) {
ans += map.getOrDefault(i, 0);
}
}
public static void test02() {
int ans = 0;
for (int i = 0; i < N; i++) {
if(map.containsKey(i)) {
ans += map.get(i);
}
}
}
public static void test03() {
int ans = 0;
for (int i = 0; i < N; i++) {
Integer v = map.get(i);
if(v != null) {
ans += v;
}
}
}