一、HashMap和HashTable
区别:
1.HashTable是Dictionary的子类,HashMap是Map接口的一个实现类;
2.HashTable中的方法是同步的,而HashMap中方法是非同步的.也就是说,在多线程的情况下用HashMap需要额外的同步机制.
Map Collections.synchronziedMap(Map m)这个方法返回一个同步的Map,封装了底层的HashMap方法,使得多线程安全.
或者采用ConcurrentMap接口;
3.HashMap中,键和值都可以为null(null键只能有一个),HashTable不允许为null。当get()方法时返回null,即表示没有该键,也可以表示该键对应的值为null。因此判断HashMap里是否存在某个键时,不能用get()方法,应该用containsKey()方法
相同:
1.有两个参数影响性能:初始容量和加载因子。
初始容量:哈希表创建时的容量,初始容量设置太高可能会浪费空间;
加载因子:对哈希表在其容量自动增加之前可以达到多满的一个尺度(默认为.75),加载因子过高虽然减少了空间开销,但同时也增加了查询成本。
当哈希表中的条目数超出了加载因子与当前容量的乘积时,则要对该哈希表进行 rehash 操作(即重建内部数据结构)。
2.所有类的“Collection视图方法”返回的Collection的iterator方法返回的迭代器是快速失败的。
二、HashMap中key和value的原理
HashMap 是基于哈希表的 Map 接口的非同步实现。此实现提供所有可选的映射操作,并允许使用 null 值和 null 键。HashMap实际上是一个“链表散列”的数据结构,即 数组和链表的结合体 。HashMap底层就是一个数组结构,数组中的每一项又是一个链表。当新建一个HashMap的时候,就会初始化一个数组。每个Map.Entry是一个Key-Value对,也是数组中的元素,它持有指向下一个元素的引用,这就构成了链表。 HashMap的存取实现:1) 存储:
当我们往HashMap中put元素的时候,先根据key的hashCode重新计算hash值,根据hash值得到这个元素在数组中的位置(即下标),如果数组该位置上已经存放有其他元素了,那么在这个位置上的元素将以链表的形式存放,新加入的放在链头,最先加入的放在链尾。如果数组该位置上没有元素,就直接将该元素放到此数组中的该位置上。
当系统决定存储HashMap中的key-value对时,完全没有考虑Entry中的value,仅仅只是根据key来计算并决定每个Entry的存储位置。我们完全可以把 Map 集合中的 value 当成 key 的附属,当系统决定了 key 的存储位置之后,value 随之保存在那里即可。hash(int h)--计算hash值的方法根据key的hashCode重新计算一次散列。此算法加入了高位计算,防止低位不变,高位变化时,造成的hash冲突。
2) 读取:
从HashMap中get元素时,首先计算key的hashCode,找到数组中对应位置的某一元素,然后通过key的equals方法在对应位置的链表中找到需要的元素。
3)Fail-Fast机制:我们知道java.util.HashMap不是线程安全的,因此如果在使用迭代器的过程中有其他线程修改了map,那么将抛出ConcurrentModificationException,这就是所谓fail-fast策略。
这一策略在源码中的实现是通过modCount域,modCount顾名思义就是修改次数,对HashMap内容的修改都将增加这个值,那么在迭代器初始化过程中会将这个值赋给迭代器的expectedModCount。在迭代过程中,判断modCount跟expectedModCount是否相等,如果不相等就表示已经有其他线程修改了Map:注意到modCount声明为volatile,保证线程之间修改的可见性。
来自:http://hi.baidu.com/suofang/blog/item/96ca7531d5935306ebc4af94.html