什么是非线程安全?
线程不安全就是在运行中不提供数据访问保护,这样就可能出现多个线程先后更改数据,造成所得到的数据是脏数据。
这里面的关键词就是多个线程同时修改数据,导致脏数据的结果。
HashMap为什么是线程不安全的?
根据非线程安全的解释,我们知道如果HashMap是线程不安全的,那么就存在数据修改的问题,那么HashMap中哪些数据会产生修改问题呢?
我们以Java 1.7的HashMap实现为例将展开讲述,在此之前,建议先阅读关于HashMap的基础知识,可以参考之前的文章Java1.7 HashMap 实现原理和源码分析,涉及的知识点主要是存储结构,我们回顾下HashMap的存储结构:
HashMap底层是一个Entry数组。当发生hash冲突的时候,hashmap是采用链表的方式来解决的,在对应的数组位置存放链表的头结点。对链表而言,新加入的节点会从头结点加入。
那么基于上述理论,当元素A与元素B的hash值不相同时,那么同时插入A元素与插入B元素,一般不会产生问题,因为不在一个链上,分别在各自链上进行操作,但是当二者hash值相同时,就极易发生冲突:。
场景1:在同一个链上进行添加操作
void addEntry(int hash, K key, V value, int bucketIndex) {
if ((size >= threshold) && (null != table[bucketIndex])) {
resize(2 * table.length);//当size超过临界阈值threshold,并且即将发生哈希冲突时进行扩容
hash = (null != key) ? hash(key) : 0;
bucketIndex = indexFor(hash, table.length);
}
createEntry(hash, key, value, bucketIndex); //采用头插法
}
我们知道头插法,就是假设存在链表A,把新的元素A1插入链表A内时,会把A1.next=链表A,然后重新赋值table[bucketIndex]=A1,假设此时另一个线程往链表A内插入元素B1,我们期望的步骤是:
A1.next=链表A
table[bucketIndex]=A1
B1.next=链表A
table[bucketIndex]=B1
最终元素是table[bucketIndex]=>A1=>B1=>原有的其他元素
但可能的执行步骤是:
A1.next=链表A
B1.next=链表A
table[bucketIndex]=A1
table[bucketIndex]=B1
最终元素是table[bucketIndex]=>B1=>原有的其他元素
A1元素被丢掉了
同样的,如果是remove()操作也发生在同一个链上时,也会存在类似的问题。
场景2:数据扩容
addEntry()中当加入新的键值对后键值对总数量超过门限值的时候会调用一个resize()操作,这个操作会新生成一个新的容量的数组,然后对原数组的所有键值对重新进行计算和写入新的数组,之后指向新生成的数组。
我们看下源码,同样存在一个赋值操作:
void resize(int newCapacity) {
...
Entry[] newTable = new Entry[newCapacity];
transfer(newTable, initHashSeedAsNeeded(newCapacity));
table = newTable; //重新赋值操作
}
同样的,假设线程A和线程B都执行插入操作,发现需要扩容时,都会各自创建一个新的数据,然后重新赋值,那么就存在先后顺序,后者会覆盖前者,导致数据丢失。
参考:https://blog.csdn.net/u011277123/article/details/91524064?