https://www.jianshu.com/p/377bb840802f
https://www.jianshu.com/p/98b68c97df9b
有些面试官会开门见山的提问:
“知道ThreadLocal吗?”
“讲讲你对ThreadLocal的理解”
当然了,也有面试官会慢慢引导到这个话题上,比如提问“在多线程环境下,如何防止自己的变量被其它线程篡改”,将主动权交给你自己,剩下的靠自己发挥。
1. ThreadLocal是什么
ThreadLocal是一个本地线程副本变量工具类
。主要用于将私有线程和该线程存放的副本对象做一个映射,各个线程之间的变量互不干扰,在高并发场景下
,可以实现无状态的调用
,特别适用于各个线程依赖不同的变量值
完成操作的场景。
2. ThreadLocal的核心机制:
-
每个Thread线程内部都有一个ThreadLocalMap。
-
ThreadLocalMap里面存储
ThreadLocal(key)
和线程的变量副本(value)
每个Thread
的对象都有一个ThreadLocalMap
,当创建一个ThreadLocal的时候
,就会将该ThreadLocal
对象添加到该Map
中,其中键就是ThreadLocal,值可以是任意类型。Thread内部的ThreadLocalMap是由ThreadLocal维护的
,由ThreadLocal负责向ThreadLocalMap获取和设置线程的变量值
。
在ThreadLocal
类中,我觉得最重要的方法就是两个:set()和get()方法
。当调用ThreadLocal的get()方法的时候,会先找到当前线程的ThreadLocalMap
,然后再找到对应的值
。set()方法也是一样。
所以对于不同的线程
,每次获取副本值时
,别的线程并不能获取到当前线程的副本值,形成了副本的隔离,互不干扰。
3. 源码解析ThreadLocal
https://www.jianshu.com/p/98b68c97df9b
public T get()
public void set(T value)
public void remove()
public T get()
1.获取当前线程的ThreadLocalMap对象threadLocals
2.从map中获取线程存储的K-V Entry节点。
3.从Entry节点获取存储的Value副本值返回。
4.map为空的话返回初始值null,即线程变量副本为null,在使用时需要注意判断NullPointerException。
set()方法
步骤:
1.获取当前线程的成员变量map
2.map非空,则重新将ThreadLocal和新的value副本放入到map中。
3.map空,则对线程的成员变量ThreadLocalMap进行初始化创建
,并将ThreadLocal和value副本放入map中。
public void set(T value) {
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null)
map.set(this, value);
else
createMap(t, value);
}
public T get() {
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null) {
ThreadLocalMap.Entry e = map.getEntry(this);
if (e != null) {
@SuppressWarnings("unchecked")
T result = (T)e.value;
return result;
}
}
return setInitialValue();
}
ThreadLocalMap getMap(Thread t) {
return t.threadLocals;
}
remove()方法
public void remove() {
ThreadLocalMap m = getMap(Thread.currentThread());
if (m != null)
m.remove(this);
}
ThreadLocalMap getMap(Thread t) {
return t.threadLocals;
}
4. ThreadLocalMap
ThreadLocalMap是ThreadLocal的内部类,没有实现Map接口,用独立的方式实现了Map的功能,其内部的Entry也独立实现。
ThreadLoalMap的Entry是继承WeakReference
(弱引用,生命周期只能存活到下次GC前),但只有Key是弱引用类型
的,Value并非弱引用
。和HashMap很大的区别是,Entry中没有next字段
,所以就不存在链表的情况了。
5. Hash冲突怎么解决
在插入过程中,根据ThreadLocal对象的hash值,定位到table中的位置i,过程如下:
-
如果当前位置是空的,那么正好,就初始化一个Entry对象放在位置i上;
-
不巧,位置i已经有Entry对象了,
如果这个Entry对象的key正好是即将设置的key
,那么重新设置Entry中的value
; -
很不巧,位置i的Entry对象,和即将设置的key没关系,那么只能找下一个空位置。
ThreadLocalMap中解决Hash冲突的方式并非链表的方式
,而是采用线性探测的方式
。所谓线性探测,就是根据初始key的hashcode值确定元素在table数组中的位置,如果发现这个位置上已经有其他key值的元素被占用,则利用固定的算法,寻找一定步长的下个位置,依次判断,直至找到能够存放的位置。这样的话,
在get的时候
,也会根据ThreadLocal对象的hash值,定位到table中的位置
,然后判断该位置Entry对象中的key是否和get的key一致
,如果不一致,就判断下一个位置。ThreadLocalMap
解决Hash冲突的方式
就是简单的步长加1或减1
,寻找下一个相邻的位置。
显然ThreadLocalMap采用线性探测的方式解决Hash冲突的效率很低,如果有大量不同的ThreadLocal对象放入map中时发送冲突,或者发生二次冲突,则效率很低。
所以这里引出的良好建议是
:每个线程只存一个变量
,这样的话所有的线程存放到map中的Key都是相同的ThreadLocal,如果一个线程要保存多个变量,就需要创建多个ThreadLocal,多个ThreadLocal放入Map中时会极大的增加Hash冲突的可能。
6. ThreadLocalMap的问题:内存泄漏
由于ThreadLocalMap的key是弱引用
,而Value是强引用
。这就导致了一个问题,ThreadLocal在没有外部对象强引用时,发生GC时弱引用Key会被回收,而Value不会回收
,如果创建ThreadLocal的线程一直持续运行,那么这个Entry对象中的value就有可能一直得不到回收,发生内存泄露
。
如何避免泄漏
在调用ThreadLocal的get()、set()可能会清除
ThreadLocalMap中key为null的Entry对象
,这样对应的value就没有GC Roots可达了
,下次GC的时候就可以被回收
,当然如果调用remove方法,肯定会删除对应的Entry对象。
既然Key是弱引用,那么我们要做的事,就是在调用ThreadLocal的get()、set()方法时完成后再调用remove方法
,将Entry节点和Map的引用关系移除
,这样整个Entry对象在GC Roots分析后就变成不可达了
,下次GC的时候就可以被回收。如果使用ThreadLocal的set方法之后,没有显示的调用remove方法,就有可能发生内存泄露,所以养成良好的编程习惯十分重要,使用完ThreadLocal之后,记得调用remove方法
。
ThreadLocal<Session> threadLocal = new ThreadLocal<Session>();
try {
threadLocal.set(new Session(1, "Misout的博客"));
// 其它业务逻辑
//用完后就删除
} finally {
threadLocal.remove();
}
7. 使用场景
数据库连接管理
,线程会话管理
等场景,只适用于独立变量副本
的情况,如果变量为全局共享的,则不适用在高并发下使用。
还记得Hibernate的session获取场景吗?
private static final ThreadLocal<Session> threadLocal = new ThreadLocal<Session>();
//获取Session
public static Session getCurrentSession(){
Session session = threadLocal.get();
//判断Session是否为空,如果为空,将创建一个session,并设置到本地线程变量中
try {
if(session ==null&&!session.isOpen()){
if(sessionFactory==null){
rbuildSessionFactory();// 创建Hibernate的SessionFactory
}else{
session = sessionFactory.openSession();
}
}
threadLocal.set(session);
} catch (Exception e) {
// TODO: handle exception
}
return session;
}
为什么?每个线程
访问数据库都应当是一个独立的Session会话
,如果多个线程共享同一个Session会话,有可能其他线程关闭连接了
,当前线程再执行提交时就会出现会话已关闭的异常
,导致系统异常。此方式能避免线程争抢Session
,提高并发下的安全性。
8. ThreadLocal与线程同步机制的比较
线程同步机制
通过对象的锁机制
保证同一时间只有一个线程去访问变量,该变量是多个线程共享的
。ThreadLocal则为每一个线程提供了一个变量副本,从而隔离了多个线程访问数据的冲突,ThreadLocal提供了线程安全的对象封装,在编写多线程代码时,可以把不安全的代码封装进ThreadLocal。概括的说,对于多线程资源共享的问题
,线程同步机制采取了时间换空间的方式,访问串行化,对象共享化
;而ThreadLocal采取了空间换时间的方式,访问并行化,对象独享化
。
9. 总结
每个ThreadLocal只能保存一个变量副本
,如果想要上线一个线程能够保存多个副本以上,就需要创建多个ThreadLocal。- ThreadLocal内部的ThreadLocalMap键为弱引用,
会有内存泄漏的风险
。 适用于无状态,副本变量独立后不影响业务逻辑的高并发场景
。如果如果业务逻辑强依赖于副本变量,则不适合用ThreadLocal解决,需要另寻解决方案。