Java里多个Map的性能比较

本文比较了Java中的三种Map实现:TreeMap、HashMap和ConcurrentSkipListMap的性能。通过大量数据插入和查找测试,展示了不同Map类型在单线程环境下的表现,并分析了各自的特点。
摘要由CSDN通过智能技术生成

原文地址:http://blog.hongtium.com/java-map-skiplist/


Java里多个Map的性能比较(TreeMap、HashMap、ConcurrentSkipListMap)

问题:

比较Java原生的 3种Map的效率。
1.  TreeMap
2.  HashMap
3.  ConcurrentSkipListMap

结果:

模拟150W以内海量数据的插入和查找,通过增加和查找两方面的性能测试,结果如下:

Map类型插入查找(在100W数据量中)
 10W50W100W150W0-1W0-25W0-50W
Concurrent
SkipListMap
62 ms227 ms433 ms689ms7 ms80 ms119 ms
HashMap 18 ms93 ms217 ms303ms2 ms13 ms45 ms
TreeMap 33 ms228 ms429 ms584 ms4ms34 ms61 ms


分析说明
 

图1- 1常数和logn函数效率对比示例图(横轴-n数据量,纵轴-f(n)时间)


TreeMap基于红黑树(一种自平衡二叉查找树)实现的,时间复杂度平均能达到O(log n)。
HashMap是基于散列表实现的,时间复杂度平均能达到O(1)。
ConcurrentSkipListMap是基于跳表实现的,时间复杂度平均能达到O(log n)。

如图所示:
当数据量增加时,HashMap会引起散列冲突,解决冲突需要多花费一些时间代价,故在f(n)=1向上浮动。
随着数据量的增加,HashMap的时间花费小且稳定,在单线程的环境下比TreeMap和ConcurrentSkipListMap在插入和查找上有很大的优势。

(1) TreeMap与HashMap相比较

Ø  HashMap里面存入的键值对在取出的时候是随机的,它根据键的HashCode值存储数据,根据键可以直接获取它的值,具有很快的访问速度。在Map 中插入、删除和定位元素,HashMap是最好的选择。

Ø  TreeMap取出来的是排序后的键值对。插入、删除需要维护平衡会牺牲一些效率。但如果要按自然顺序或自定义顺序遍历键,那么TreeMap会更好。

本测试增加和查找功能,HashMap比TreeMap的效率要高。

 


(2) TreeMap与ConcurrentSkipListMap相比较

 

Ø  Skip list(跳表)是一种可以代替平衡树的数据结构,默认是按照Key值升序的。Skip list让已排序的数据分布在多层链表中,以0-1随机数决定一个数据的向上攀升与否,通过“空间来换取时间”的一个算法,在每个节点中增加了向前的指针,在插入、删除、查找时可以忽略一些不可能涉及到的结点,从而提高了效率。
从概率上保持数据结构的平衡比显示的保持数据结构平衡要简单的多。对于大多数应用,用Skip list要比用树算法相对简单。由于Skip list比较简单,实现起来会比较容易,虽然和平衡树有着相同的时间复杂度(O(logn)),但是skip list的常数项会相对小很多。Skip list在空间上也比较节省。一个节点平均只需要1.333个指针(甚至更少)。
                
图1-2 Skip list结构图(以7,14,21,32,37,71,85序列为例)

Skip list的性质

(1) 由很多层结构组成,level是通过一定的概率随机产生的。
(2) 每一层都是一个有序的链表,默认是升序,也可以根据创建映射时所提供的Comparator进行排序,具体取决于使用的构造方法。
(3) 最底层(Level 1)的链表包含所有元素。
(4) 如果一个元素出现在Level i 的链表中,则它在Level i 之下的链表也都会出现。
(5) 每个节点包含两个指针,一个指向同一链表中的下一个元素,一个指向下面一层的元素。

Ø  ConcurrentSkipListMap具有Skip list的性质 ,并且适用于大规模数据的并发访问。多个线程可以安全地并发执行插入、移除、更新和访问操作。与其他有锁机制的数据结构在巨大的压力下相比有优势。

Ø  TreeMap插入数据时平衡树采用严格的旋转(比如平衡二叉树有左旋右旋)来保证平衡,因此Skip list比较容易实现,而且相比平衡树有着较高的运行效率。
本测试的增加功能,ConcurrentSkipListMap和TreeMap效率相差不大。

查找功能在50W数据量以后,TreeMap更有效率,因为ConcurrentSkipListMap自带锁机制,会占用一些效率,但对于多线程并发的环境下,ConcurrentSkipListMap的效率会比Treep要好的。

本测试查找方法使用Map的get方法,循环、离散获取。对于ConcurrentSkipListMap,获得顺序片段,可用subMap()方法,提取50w的子序列只需要1ms,具有巨大优势。 SkipListMap的范围查询效率比HashMap和TreeMap效率都要高。


(3) SkipList 参考资料

[1] http://stackoverflow.com/questions/256511/skip-list-vs-binary-tree
[2] http://www.cnblogs.com/xuqiang/archive/2011/05/22/2053516.html
[3] http://imtinx.iteye.com/blog/1291165

7 Responses to Java里多个Map的性能比较(TreeMap、HashMap、ConcurrentSkipListMap)

  1. Hongtium

    由于跳表Skip List内部结构简单,所以实现容易;同时,由于没有平衡树那样的插入删除re-balance问题,使得并发控制粒度很细,也简单很多,非常适合高并发场景。所以,在NoSQL开源工具里,Google的LevelDB,以及Redis,都使用跳表作为“外排序”的基础数据结构。

  2. Pingback: Hongtium » HashMap、Hashtable、LinkedHashMap、和TreeMap介绍和区别



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值