多线程与并发-ThreadLocal

最新推荐文章于 2023-02-11 18:32:10 发布

程序员的压哨绝杀

最新推荐文章于 2023-02-11 18:32:10 发布

阅读量596

点赞数 1

分类专栏：并发编程文章标签： java 并发编程 thread

本文链接：https://blog.csdn.net/lhx574938077/article/details/104318396

版权

并发编程专栏收录该内容

1 篇文章 0 订阅

订阅专栏

什么是ThreadLocal?

ThreadLocal 并不是一个线程，而是保存线程本地化对象的容器。当运行于多线程环境的某个对象使用ThreadLocal维护变量时，ThreadLocal提供了get与set等访问接口或方法，为每个使用该变量的线程分配一个独立的变量副本。

我们来看下ThreadLocal的结构，如下图

一个线程对应一个ThreadLocalMap ，可以存储多个ThreadLocal对象。get()就是当前线程获取自己的ThreadLocalMap.
ThreadLocal对象作为key、独享数据作为value。
ThreadLocalMap可参考HashMap，在ThreadMap里面存在Entry数组也就是一个Entry一个键值对。
线程根据使用那一小块的Threadlocal，根据ThreadLocal对象作为key，去获取存储于ThreadLocalMap中的值。

注意：每个Thread线程内部都有一个Map。Map里面存储key是线程本地对象即ThreadLocal。Thread内部的Map是由ThreadLocal维护的，由ThreadLocal负责向map获取和设置线程的变量值。

对于不同的线程，每次获取副本值时，别的线程并不能获取到当前线程的副本值，形成了副本的隔离，互不干扰。我们可以看到Thread 源码中有关于ThreadLocal部分

public class Thread implements Runnable {    /* ThreadLocal values pertaining to this thread. This map is maintained     * by the ThreadLocal class. */    ThreadLocal.ThreadLocalMap threadLocals = null;}

关于Thread、ThreadLocal、ThreadLocalMap具体的关系，可以看下面这张图。

因为ThreadLocal实例实际上也是被其创建的类持有（更顶端应该是被线程持有）。而ThreadLocal的值其实也是被线程实例持有。

它们都是位于堆上，只是通过一些技巧将可见性修改成了线程可见。

ThreadLocal 的作用是什么？

防止任务在共享资源上产生冲突，防止对可变的单实例变量或全局变量进行共享。线程本地存储是一种自动化机制，可以为使用相同变量的每个不同的线程都创建不同的存储。

从前面的介绍里我们能知道 ThreadLocal是一个本地线程副本变量工具类。主要用于将私有线程和该线程存放的副本对象做一个映射，各个线程之间的变量互不干扰，在高并发场景下，可以实现无状态的调用，特别适用于各个线程依赖不同的变量值完成操作的场景。

ThreadLocal 可以维持线程封闭性，这个类能使线程中的某个值与保存值的对象关联起来。ThreadLocal提供了get与set等访问接口或方法，这些方法为每个使用该变量的线程都存有一份独立的副本，因此get总是返回由当前线程在调用set时设置的最新值。通常用于防止对可变的单实例变量或全局变量进行的共享。

当某个频繁执行的操作需要一个临时对象，例如一个缓冲区，而同时又希望避免在每次执行时都重新分配该临时对象，就可使用该技术。

下面我们就来通过源码，分析ThreadLocal一些常用的方法。

首先是get() 方法。get()方法用于获取当前线程的副本变量值。 ThreadLocal.set()、ThreadLocal.get()方法，就相当于把数据存储于线程本地，取也是在本地内存读取。就不会像synchronized需要频繁的修改主内存的数据，再把数据复制到工作内存，也大大提高访问效率。

获取当前线程的ThreadLocalMap对象threadLocals
从map中获取线程存储的K-V Entry节点。
从Entry节点获取存储的Value副本值返回。
map为空的话返回初始值null，即线程变量副本为null，在使用时需要注意判断NullPointerException。

public T get() {    Thread t = Thread.currentThread();    ThreadLocalMap map = getMap(t);    if (map != null) {        ThreadLocalMap.Entry e = map.getEntry(this);        if (e != null)            return (T)e.value;    }    return setInitialValue();}
ThreadLocalMap getMap(Thread t) {    return t.threadLocals;}
private T setInitialValue() {    T value = initialValue();    Thread t = Thread.currentThread();    ThreadLocalMap map = getMap(t);    if (map != null)        map.set(this, value);    else        createMap(t, value);    return value;}
protected T initialValue() {    return null;}

我们要注意的是

一个线程对应一个ThreadLocalMap，get()就是当前线程获取自己的ThreadLocalMap。
线程根据使用那一小块的threadlocal，根据ThreadLocal对象作为key，去获取存储于ThreadLocalMap中的值。

接下来是 set() 方法。set()方法用于保存当前线程的副本变量值。

获取当前线程的成员变量map
map非空，则重新将ThreadLocal和新的value副本放入到map中。
map空，则对线程的成员变量ThreadLocalMap进行初始化创建，并将ThreadLocal和value副本放入map中。

public void set(T value) {    Thread t = Thread.currentThread();    ThreadLocalMap map = getMap(t);    if (map != null)        map.set(this, value);    else        createMap(t, value);}
ThreadLocalMap getMap(Thread t) {    return t.threadLocals;}
void createMap(Thread t, T firstValue) {    t.threadLocals = new ThreadLocalMap(this, firstValue);}

还有些常用的方法，比如initialValue()为当前线程初始副本变量值、remove()方法移除当前前程的副本变量值。就不逐一进行分析了。

ThreadLocalMap 内部结构

ThreadLocalMap是ThreadLocal的内部类，没有实现Map接口，用独立的方式实现了Map的功能，其内部的Entry也独立实现。

在ThreadLocalMap中，也是用Entry来保存K-V结构数据的。但是Entry中key只能是ThreadLocal对象，这点被Entry的构造方法已经限定死了。这里大家可以看到，继承的是 WeakReference 对象，后面会讲到。

static class Entry extends WeakReference<ThreadLocal> {    /** The value associated with this ThreadLocal. */    Object value;    Entry(ThreadLocal k, Object v) {        super(k);        value = v;    }}

如何解决Hash冲突

和HashMap的最大的不同在于，ThreadLocalMap结构非常简单，没有next引用，也就是说ThreadLocalMap中解决Hash冲突的方式并非链表的方式，而是采用线性探测的方式，所谓线性探测，就是根据初始key的hashcode值确定元素在table数组中的位置，如果发现这个位置上已经有其他key值的元素被占用，则利用固定的算法寻找一定步长的下个位置，依次判断，直至找到能够存放的位置。

ThreadLocalMap解决Hash冲突的方式就是简单的步长加1或减1，寻找下一个相邻的位置。ThreadLocalMap采用线性探测的方式解决Hash冲突的效率很低，如果有大量不同的ThreadLocal对象放入map中时发送冲突，或者发生二次冲突，则效率很低。

如果每个线程只存一个变量，这样的话所有的线程存放到map中的Key都是相同的ThreadLocal，如果一个线程要保存多个变量，就需要创建多个ThreadLocal，多个ThreadLocal放入Map中时会极大的增加Hash冲突的可能。

ThreadLocal 内存泄露问题

上面写到， Entry继承的是 WeakReference 对象。由于ThreadLocalMap的key是弱引用，而Value是强引用。这就导致了一个问题，ThreadLocal在没有外部对象强引用时，发生GC时弱引用Key会被回收，而Value不会回收，如果创建ThreadLocal的线程一直持续运行，那么这个Entry对象中的value就有可能一直得不到回收，发生内存泄露。

只要这个线程对象被gc回收，就不会出现内存泄露，但在threadLocal设为null和线程结束这段时间不会被回收的，就发生了我们认为的内存泄露。最要命的是线程对象不被回收的情况，这就发生了真正意义上的内存泄露。比如使用线程池的时候，线程结束是不会销毁的，会再次使用的。就可能出现内存泄露。

如何避免泄漏

既然Key是弱引用，那么我们要做的事，就是在调用ThreadLocal的get()、set()方法时完成后再调用remove方法，将Entry节点和Map的引用关系移除，这样整个Entry对象在GC Roots分析后就变成不可达了，下次GC的时候就可以被回收

ThreadLocal<Ingeger> threadLocal = new ThreadLocal<Integer>();try {    threadLocal.set(1);    // 其它业务逻辑} finally {    threadLocal.remove();}

在ThreadLocalMap中的set/getEntry方法中，会对key为null（也即是ThreadLocal为null）进行判断，如果为null的话，那么是会对value置为null的。怕的情况就是，threadLocal对象设null了，开始发生“内存泄露”，然后使用线程池，这个线程结束，线程放回线程池中不销毁，这个线程一直不被使用，或者分配使用了又不再调用get,set方法，那么这个期间就会发生真正的内存泄露。

Threadlocal里面使用了一个存在弱引用的map,当释放掉threadlocal的强引用以后,map里面的value却没有被回收.而这块value永远不会被访问到了. 所以存在着内存泄露. 最好的做法是将调用threadlocal的remove方法。

总结

JVM利用设置ThreadLocalMap的Key为弱引用，来避免内存泄露。
JVM利用调用remove、get、set方法的时候，回收弱引用。
当ThreadLocal存储很多Key为null的Entry的时候，而不再去调用remove、get、set方法，那么将导致内存泄漏。
当使用static ThreadLocal的时候，延长ThreadLocal的生命周期，那也可能导致内存泄漏。因为，static变量在类未加载的时候，它就已经加载，当线程结束的时候，static变量不一定会回收。那么，比起普通成员变量使用的时候才加载，static的生命周期加长将更容易导致内存泄漏危机。

那为什么ThreadLocalMap的key使用弱引用的ThreadLcal对象？

Key使用强引用：也就是上述说的情况，引用 ThreadLocal 的对象被回收了，ThreadLocal 的引用ThreadLocalMap 的 Key 为强引用并没有被回收，如果不手动回收的话，ThreadLocal将不会回收那么将导致内存泄漏。
Key使用弱引用：引用的ThreadLocal的对象被回收了，ThreadLocal 的引用 ThreadLocalMap 的 Key 为弱引用，如果内存回收，那么将 ThreadLocalMap 的 Key 将会被回收，ThreadLocal 也将被回收。value在 ThreadLocalMap 调用get、set、remove的时候就会被清除。
比较两种情况，我们可以发现：由于ThreadLocalMap的生命周期跟Thread一样长，如果都没有手动删除对应key，都会导致内存泄漏，但是使用弱引用可以多一层保障：弱引用ThreadLocal不会内存泄漏，对应的value在下一次ThreadLocalMap调用set,get,remove的时候会被清除。

应用场景举例

每个线程访问数据库都应当是一个独立的Session会话，如果多个线程共享同一个Session会话，有可能其他线程关闭连接了，当前线程再执行提交时就会出现会话已关闭的异常，导致系统异常。此方式能避免线程争抢Session，提高并发下的安全性。

private static final ThreadLocal<Session> threadLocal = new ThreadLocal<Session>();//获取Sessionpublic static Session getCurrentSession(){    Session session =  threadLocal.get();    //判断Session是否为空，如果为空，将创建一个session，并设置到本地线程变量中    try {        if(session ==null&&!session.isOpen()){            if(sessionFactory==null){                rbuildSessionFactory();// 创建Hibernate的SessionFactory            }else{                session = sessionFactory.openSession();            }        }        threadLocal.set(session);    } catch (Exception e) {        // TODO: handle exception    }    return session;}

ThreadLocal 与 Thread 同步机制的比较

ThreadLocal 与线程同步机制都是为了解决多线程中相同变量的访问冲突问题。

在同步机制中，通过对象的锁机制保证同一时间只有一个线程访问变量。这时该变量是多个线程共享的，使用同步机制要求程序缜密地分析什么时候对变量进行读/写、什么时候需要锁定某个对象、什么时候释放对象所等繁杂的问题，程序设计难度较大。

而ThreadLocal 从另一个角度来解决多线程的并发问题。ThreadLocal 为每个线程提供了一个独立的变量副本，从而隔离了多个线程对访问数据的冲突。因为每个线程都拥有自己的变量副本，因而也就没有必要对改变量进行同步。ThreadLocal 提供了线程安全的对象封装，在编写多线程代码时，可以把不安全的变量封装进ThreadLocal。

对多线程共享资源

同步机制：以时间换空间、访问串行化、对象共享化。仅提供一份变量，让不同的线程排队访问。

ThreadLocal：以空间换时间、访问并行化、对象独享化。为每个线程都提供了一份变量，可以同时访问互不影响

欢迎关注公众号，让我们一起学习探讨问题

程序员的压哨绝杀

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
多线程与并发-ThreadLocal

什么是ThreadLocal?ThreadLocal并不是一个线程，而是保存线程本地化对象的容器。当运行于多线程环境的某个对象使用ThreadLocal维护变量时，ThreadLocal提供了get与set等访问接口或方法，为每个使用该变量的线程分配一个独立的变量副本。我们来看下ThreadLocal的结构，如下图一个线程对应一个ThreadLocalMap，可以存储多个Thr...
复制链接

扫一扫

专栏目录