map基操,hashmap与hashtable,concurrenthashmap和hashtable,hashmap和treemap,concurrentHashmap是如何实现线程安全的
map基本操作,hashmap与hashtable区别,hashmap需要注意的点
map存储的是k-v键值对映射的数据
实现子类:
HashMap:数组+链表(1.7) 数组+链表+红黑树(1.8)
LinkedHashMap:链表
TreeMap:红黑树
基本api操作:
增加:
put(k,v) 添加元素
查找:
isEmpty 判断是否为空
size 返回map的大小
containsKey
containsValue
get
删除:
clear 清空集合中的所有元素
remove:删除指定元素
Map.entry:表示的是K-V组合的一组映射关系,key和value成组出现
hashmap跟hashtable的区别:
1、hashmap线程不安全,效率比较高,hashtable线程安全,效率低
2、hashmap中key和value都可以为null,(只允许一个key为null),hashtable不允许为空
hashmap中需要注意点:
a:为什么hashmap初始值为2的N次幂,
1、2的N次幂减1的二进制为...11111,这样在进行hash(key)操作的时候,可以把
取余运算转换成与运算,&要比取模运算效率要高
hash & (initCapacity-1)
2、在扩容之后涉及到元素的迁移过程,如果hashmap初始值为2的N次幂,迁移的
时候只需要判断原key值得二进制的前一位是0或者是1即可(比如第一次扩容,本
来只看后四位,因为16-1=15的二进制是01111,扩容是乘2,即左移一位,所以要
看11111,后四位还是1,所以只需要看原本key值二进制的倒数第5位是0是1即可)
如果是0,表示新数组和就数组的下标位置不变,如果是1,只需要将索引位置加上旧的数组的长度值即为新数组的下标
b: 如果在hashmap同一位置有8个Node,为了提高查询效率,在7个的时候就开始讲这条链表转化为红黑树
c:扩容操作是table.length*2,左移一位
d: hashmap在构造函数中没有申请地址空间,在put函数中才申请了地址空间。
e:扩容后元素迁移时,同一个位置的顺序会反过来(头插法)
f: 扰动函数:return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);使计算哈希
值得时候包含了低16位和高16位的特征,从而使哈希值更加不确定来减少碰撞的频率
g:HashMap默认初始容量为16,负载因子loadFactor为0.75,也就是说只能存储12个元素,当put第13个元素时就需要resize数组将容量扩充到32。
h:简单翻译一下就是在理想情况下,使用随机哈希码,节点出现的频率在hash桶中遵循泊松分布,同时给出了桶中元素个数和概率的对照表。当桶中元素到达8个的时候,概率已经变得非常小,也就是说用0.75作为加载因子,每个碰撞位置的链表长度超过8个是几乎不可能的。
i:static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
volatile V val;
volatile Node<K,V> next;
...
}
value和next指针使用了volatile来保证其可见性
concurrenthashmap和hashtable区别
- concurrenthashmap的内部实现和hashmap大部分操作是相同的,例如:
- 初始化【默认大小16,2的n次幂,这样hash(key)操作的时候,可以把取余运算转换成与运算,&要比取模运算效率要高,hashcode & (initCapacity-1)】,
- 扩容【扩容因子默认0.75:简单翻译一下就是在理想情况下,使用随机哈希码,节点出现的频率在hash桶中遵循泊松分布,同时给出了桶中元素个数和概率的对照表。当桶中元素到达8个的时候,概率已经变得非常小,也就是说用0.75作为加载因子,每个碰撞位置的链表长度超过8个是几乎不可能的。
】 - 链表向红黑树的转变【如果在hashmap同一位置有8个Node,为了提高查询效率,在7个的时候就开始讲这条链表转化为红黑树】等。
- ConcurrentHashmap大量使用了CAS方法,大大降低锁带来的性能消耗。 在ConcurrentHashMap中还定义了三个原子操作,用于对指定位置的节点进行操作。这三种原子操作被广泛地使用在ConcurrentHashMap的get和put等方法中。
// 获取tab数组的第i个node
static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
}
// 利用CAS算法设置i位置上的node节点。在CAS中,会比较内存中的值与你指定的这个值是否相等,如果相等才接受
static final <K,V> boolean casTabAt(Node<K,V>[] tab, int i,
Node<K,V> c, Node<K,V> v) {
return U.compareAndSwapObject(tab, ((long)i << ASHIFT) + ABASE, c, v);
}
// 利用volatile方法设置第i个节点的值,这个操作一定是成功的。
static final <K,V> void setTabAt(Node<K,V>[] tab, int i, Node<K,V> v) {
U.putObjectVolatile(tab, ((long)i << ASHIFT) + ABASE, v);
}
JDK8中ConcurrentHashMap的实现使用的是锁分离思想,只是锁住的是一个node,而锁住Node之前的操作是基于在volatile和CAS之上无锁并且线程安全的。
concurrentHashmap是如何实现线程安全的
–init–:在put函数中会进行init操作,这里可能存在线程安全问题,即多个线程对同一个map同时进行初始化。因此ConcurrentHashMap在进行初始化数组的时候使用了乐观锁CAS操作来决定到底哪个线程有资格进行初始化,其他线程只能等待,主要使用的方法有:
- volatile变量(sizeCtl):它是一个标记位,用来告诉其他线程这个坑位有没有人在,其线程间的可见性由volatile保证。
- CAS操作:CAS操作保证了设置sizeCtl标记位的原子性,保证了只有一个线程能设置成功。
–put–:该容器减小了锁的粒度,若Hash完美不冲突的情况下,可以同时支持n个线程同时put操作,n为Node数组大小,在默认大小16下,可以支持最大同时16个线程无竞争同时操作且线程安全。当hash冲突严重时,Node链表越来越长,将导致严重的锁竞争,此时会进行扩容,将Node进行再散列,下面会介绍扩容的线程安全性。总结一下用到的并发技巧:
- 减小锁粒度:将Node链表的头结点作为锁,若在默认大小16的情况下,将有16把锁,大大减小了锁金正,这样可以将串行的部分大大缩小,在理想情况下,线程的put操作都为并行操作。同时直接锁住头结点,保证了线程安全。
- Unsafe的getObjectVolatile方法:此方法确保获取到的值是最新的。
–扩容–:在扩容时,ConcurrentHashMap支持多线程并发扩容,在扩容过程中同时支持get查数据,若有线程put数据,还会帮助一起扩容,这种无阻塞算法,将并行最大化的设计,堪称一绝。
- 在进行迁移时要分低位Node和高位Node,低位Node链表放入原下标处,高位Node则需要加上原Node数组的长度。这样就可以保证高位Node在迁移到新的Node数组中依然可以使用hash算法散列到对应的下标的数组中了。
- 最后将原Node数组中对应下标Node对象设置为fwd标记Node,表示该节点迁移完成,到这里,一个节点的迁移就完成了,将进行下一个节点的迁移。
- 迁移过程中的get操作:在get操作的源码中,会判断Node中的hash是否小于0,是否还记得我们的占位Node,其hash为MOVED,为常量值-1,所以此时判断线程正在迁移,委托给fwd占位Node去查找值,
总结:ConcurrentHashMap运用各类CAS操作,将扩容操作的并发性能实现最大化,在扩容过程中,就算有线程调用get查询方法,也可以安全的查询数据,若有线程进行put操作,还会协助扩容,利用sizeCtl标记位和各种volatile变量进行CAS操作达到多线程之间的通信、协助,在迁移过程中只锁一个Node节点,即保证了线程安全,又提高了并发性能。
转载,hashmap,linkedmap,treemap一些总结
一些转自https://www.jianshu.com/p/57d3497ca720的总结
Map主要用于存储健值对,根据键得到值,因此不允许键重复(重复会覆盖),但允许值重复。
- HashMap
Hashmap是一个最常用的Map,它根据键的HashCode值存储数据,根据键可以直接获取它的值,具有很快的访问速度。遍历时,取得数据的顺序是完全随机的;
HashMap最多只允许一条记录的键为Null;允许多条记录的值为Null;
HashMap不支持线程的同步(非线程安全),即任一时刻可以有多个线程同时写HashMap,可能会导致数据的不一致;
同步,可以用Collections的synchronizedMap方法使HashMap具有同步的能力,或者使用ConcurrentHashMap。
在Map中插入、删除和定位元素,HashMap是最好的选择。
AbstractMap抽象类,(HashMap继承AbstractMap)覆盖了equals()和hashCode()方法以确保两个相等映射返回相同的哈希码。如果两个映射大小相等、包含同样的键且每个键在这两个映射中对应的值都相同,则这两个映射相等。
HashMap():构建一个空的哈希映像
HashMap(Map m):构建一个哈希映像,并且添加映像m的所有映射
HashMap(int initialCapacity):构建一个拥有特定容量的空的哈希映像
HashMap(int initialCapacity, float loadFactor):构建一个拥有特定容量和加载因子的空的哈希映像
- HashTable
HashTable与HashMap类似,它不允许记录的键或者值为空;
支持线程的同步(线程安全),即任一时刻只有一个线程能写HashTable,因此导致了Hashtable在写入时会比较慢。
- LinkedHashMap
LinkedHashMap是HashMap的一个子类;
LinkedHashMap保存了记录的插入顺序,在用Iterator遍历LinkedHashMap时,先得到的记录肯定是先插入的;
在遍历的时候会比HashMap慢,不过有种情况例外,当HashMap容量很大,实际数据较少时,遍历起来可能会比LinkedHashMap慢,因为LinkedHashMap的遍历速度只和实际数据有关,和容量无关,而HashMap的遍历速度和他的容量有关。
- TreeMap
TreeMap实现SortMap接口,能够把它保存的记录根据键排序,默认是按键值的升序排序,也可以指定排序的比较器。当用Iterator遍历TreeMap时,得到的记录是排过序的。
TreeMap取出来的是排序后的键值对。但如果您要按自然顺序或自定义顺序遍历键,那么TreeMap会更好。
TreeMap基于红黑树实现。TreeMap没有调优选项,因为该树总处于平衡状态。
非线程安全
TreeMap():构建一个空的映像树
TreeMap(Map m):构建一个映像树,并且添加映像m中所有元素
TreeMap(Comparator c):构建一个映像树,并且使用特定的比较器对关键字进行排序
TreeMap(SortedMap s):构建一个映像树,添加映像树s中所有映射,并且使用与有序映像s相同的比较器排序
- 总结及注意
HashSet是通过HashMap实现的,TreeSet是通过TreeMap实现的,只不过Set用的只是Map的key;
Map的key和Set都有一个共同的特性就是集合的唯一性。TreeMap更是多了一个排序的功能。
hashCode和equal(),HashMap因为无需排序所以只需要关注定位和唯一性即可。
hashCode是用来计算hash值的,hash值是用来确定hash表索引的;
hash表中的一个索引处存放的是一张链表,所以还要通过equal方法循环比较链上的每一个对象才可以真正定位到键值对应的Entry;
put时,如果hash表中没定位到,就在链表前加一个Entry;如果定位到了,则更换Entry中的value,并返回旧value。
由于TreeMap需要排序,所以需要一个Comparator为键值进行大小比较。当然也是用Comparator定位的。
Comparator可以在创建TreeMap时指定;
如果创建时没有确定,那么就会使用key.compareTo()方法,这就要求key必须实现Comparable接口;
TreeMap是使用Tree数据结构实现的,所以使用compare接口就可以完成定位。
Collection没有get()方法来取得某个元素,只能通过iterator()遍历元素。
一般使用ArrayList,用LinkedList构造堆栈stack、队列queue。
LinkedList是由列表实现的List。对顺序访问进行了优化,向List中间插入与删除得开销不大,随机访问则相对较慢(可用ArrayList代替)。它具有方法addFirst()、addLast()、getFirst()、getLast()、removeFirst()、removeLast(),这些方法(没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈、队列和双向队列使用。
Map中元素,可以将key序列、value序列单独抽取出来。
使用keySet()抽取key序列,将map中的所有keys生成一个Set。
使用values()抽取value序列,将map中的所有values生成一个Collection。
hashmap和treemap区别
Map:在数组中是通过数组下标来对 其内容进行索引的,而Map是通过对象来对 对象进行索引的,用来 索引的对象叫键key,其对应的对象叫值value;
1、HashMap是通过hashcode()对其内容进行快速查找的;HashMap中的元素是没有顺序的;
TreeMap中所有的元素都是有某一固定顺序的,如果需要得到一个有序的结果,就应该使用TreeMap;
2、HashMap和TreeMap都不是线程安全的;
3、HashMap继承AbstractMap类;覆盖了hashcode() 和equals() 方法,以确保两个相等的映射返回相同的哈希值;
TreeMap继承SortedMap类;他保持键的有序顺序;
4、HashMap:基于hash表实现的;使用HashMap要求添加的键类明确定义了hashcode() 和equals() (可以重写该方法);为了优化HashMap的空间使用,可以调优初始容量和负载因子;
TreeMap:基于红黑树实现的;TreeMap就没有调优选项,因为红黑树总是处于平衡的状态;
5、HashMap:适用于Map插入,删除,定位元素;
TreeMap:适用于按自然顺序或自定义顺序遍历键(key);