8.ThreadLocal

1、ThreadLocal简介

1.1、面试题

ThreadLocal中ThreadLocalMap的数据结构和关系?

ThreadLocalkey是弱引用,这是为什么?

ThreadLocal内存泄露问题你知道吗?

ThreadLocal中最后为什么要加remove方法?

1.2、是什么

不必写回主内存

ThreadLoca提供线程局部变量。这些变量与正常的变量不同

因为每一个线程在访问ThreadLocal实例的时候(通过其getset方法)都有自己的、独立初始化的变量副本

ThreadLocal实例通常是类中的私有静态字段,

使用它的目的是希望将状态(例如,用户ID或事务ID〉与线程关联起来。

1.3、能干嘛

实现每一个线程都有自己专属的本地变量副本(自己用自己的变量不麻烦别人,不和其他人共享,人人有份,人各一份),
主要解决了让每个线程绑定自己的值,通过使用get()set()方法,获取默认值或将其值更改为当前线程所存的副本的值从而避免了线程安全问题

比如我们之前讲解的8锁案例,资源类是使用同一部手机,多个线程抢夺同一部手机使用,假如人手一份是不是天下太平? ?


原来的

image-20221002235018495


image-20221002234925847


人手一份

image-20221002235117829


1.4、helloworld讲起

5个销售卖房子,集团高层只关心销售总量的准确统计数,按照总销售额统计,方便集团公司给部分发送奖金

上述需求变化了

希望各自吃饭

各凭销售本事提成,按照出单数各自统计

  • 比如某房产中介销售都有自己的销售额指标,自己专属自己的,不和别人掺和
class House {
    int saleCount = 0;

    public synchronized void saleHouse() {
        saleCount++;
    }

/*    ThreadLocal<Integer> saleVolume = new ThreadLocal<Integer>(){
        @Override
        protected Integer initialValue() {
            return 0;
        }
    };//通常使用匿名内部类*/

    ThreadLocal<Integer> saleVolume = ThreadLocal.withInitial(() -> 0);//更上面一样

    //每个线程都有属于自己的本地变量副本,人手一份
    public void saleVolumeByThreadLocal() {
        saleVolume.set(1 + saleVolume.get());
    }

}

public class ThreadLocalDemo {
    public static void main(String[] args) {
        House house = new House();
        for (int i = 0; i < 5; i++) {
            new Thread(() -> {
                int size = new Random().nextInt(5) + 1;
//                System.out.println(size);
                for (int j = 0; j < size; j++) {
                    house.saleHouse();
                    house.saleVolumeByThreadLocal();
                }
                System.out.println(Thread.currentThread().getName() + "\t号销售处多少套" + house.saleVolume.get());
            }, String.valueOf(i)).start();
        }
        try {
            TimeUnit.MILLISECONDS.sleep(3);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println(Thread.currentThread().getName() + "\t" + house.saleCount);
    }
}

1.5、remove()

image-20221003193715053

【强制】必须回收自定义的ThreadLocal变量,尤其在线程池场景下,线程经常会被复用,如果不清理自定义的ThreadLocal变量,可能会影响后续业务逻辑和造成内存泄露等问题。尽量在代理中使用 try-finally块进行回收

try {
    for (int j = 0; j < size; j++) {
        house.saleHouse();
        house.saleVolumeByThreadLocal();
    }
    System.out.println(Thread.currentThread().getName() + "\t号销售处多少套" + house.saleVolume.get());
}finally {
    house.saleVolume.remove();//防止影响后续业务逻辑和造成内存泄露等问题
}

1.6、线程复用&remove()

class MyData {
    ThreadLocal<Integer> threadLocalField = ThreadLocal.withInitial(() -> 0);//更上面一样

    public void add() {
        threadLocalField.set(threadLocalField.get() + 1);
    }
}

//【强制】必须回收自定义的ThreadLocal变量,**尤其在线程池场景下,线程经常会被复用**,
// 如果不清理自定义的ThreadLocal变量,
// 可能会**影响后续业务逻辑和造成内存泄露**等问题。尽量在代理中使用try-finally块进行回收。
public class ThreadLocalDemo2 {
    public static void main(String[] args) {
        MyData myData = new MyData();
        //线程复用,每个线程执行完一个任务应该恢复到原始状态 myData.threadLocalField.remove();
        //防止之前的结果造成影响
        ExecutorService threadPool = Executors.newFixedThreadPool(3);
        try {
            for (int i = 0; i < 10; i++) {
                threadPool.submit(() -> {
                    try {
                        Integer bInt = myData.threadLocalField.get();
                        myData.add();
                        Integer aInt = myData.threadLocalField.get();
                        System.out.println(Thread.currentThread().getName() + "\t bInt" + bInt
                                + "\t aInt" + aInt);
                    } finally {
                        myData.threadLocalField.remove();
                    }
                });
            }
        } finally {
            threadPool.shutdown();
        }
    }
}

1.7、上述总结

因为每个Thread内有自己的实例副本且该副本只由当前线程自己使用

既然其它Thread不可访问,那就不存在多线程间共享的问题。

统一设置初始值,但是每个线程对这个值的修改都是各良线程互相独立

一句话

  • 加入synchronized或者Lock控制资源的访问顺序

  • 人手一份,大家各自安好,没必要抢夺

2、ThreadLocal源码分析

2.1、Thread,ThreadLocal,ThreadLocalMap关系

2.1.1、Thread和ThreadLocal

image-20221003195302780

各自线程,人手一份

2.1.2、ThreadLocal和ThreadLocalMap

image-20221003195330010

2.1.3、All三者总概括

threadLocalMap实际上就是一个以threadLocal实例为key,任意对象为valueEntry象。

image-20221003200330932

当我们为threadLocal变量赋值,实际上就是以当前threadLocal实例为key,值为valueEntry往这个threadLocalMap中存放

image-20221003200523024

image-20221003200815836


2.2、总结

近似的可以理解为:

ThreadLocalMap从字面上就可以看出这是一个保存ThreadLocal对象的map(其实是以ThreadLocalKey),不过是经过了两层包装的ThreadLocal对象:

image-20221003200948333

JVM内部维护了一个线程版的Map<ThreadLocal,Value>
(通过ThreadLocal对象的set方法,结果把ThreadLocal对象自己当做key,放进了ThreadLoalMap中),

每个线程要用到这个T的时候,用当前的线程去Map里面获取,

通过这样让每个线程都拥有了自己独立的变量

人手一份,竞争条件被彻底消除,在并发模式下是绝对安全的变量。

每个线程通过ThreadlocalMap获取ThreadLocal对应的T对象


image-20221003221131049

ThreadLocal是一个壳子,真正的存储结构是ThreadLocal里有ThreadLoclMap这么个内部类,每个Thread对象维护着一个TheadLocaMap的引用,ThreadLocalMapThreadLocal的内部类,用Entry来进行存储。

  1. 调用ThreadLocalset()方法时,实际上就是往ThreadLocalMap设置值,keyThreadLocal对象,值Value是传递进来的对象

  2. 调用ThreadLocalget()方法时,实际上就是往ThreadLocalMap获取值,keyThreadLocal对象
    ThreadLocal本身并不存储值(ThreadLocal是一个壳子),它只是自己作为一个key来让线程从ThreadLocalMap获取value。正因为这个原理,所以ThreadLocal能够实现“数据隔离”,获取当前线程的局部变量值,不受其他线程影响~

3、ThreadLocal内存泄漏问题

3.1、面试题

image-20221003202727855

为什么要弱引用?不用如何?

3.2、什么是内存泄漏

不再会被使用的对象或者

变量占用的内存不能被回收

就是内存泄露。

单例模式(饿汉式),连接没有关闭

3.3、谁惹的祸?

3.3.1、再回首ThreadLocalMap

static class ThreadLocalMap {
    static class Entry extends WeakReference<ThreadLocal<?>> {
        /** The value associated with this ThreadLocal. */
        Object value;

        Entry(ThreadLocal<?> k, Object v) {
            super(k);
            value = v;
        }
    }
}

ThreadLocalMap从字面上就可以看出这是一个保存ThreadLocal对象的map(以ThreadLocalKey),不过是经过了两层包装的ThreadLocal对象

(1)第一层包装是使用WeakReference<ThreadLocal<?>>ThreadLocal对象变成一个弱引用的对象;
(2〉第二层包装是定义了一个专门的类Entry 来扩展WeakReference<ThreadLocal<?>>

3.3.2、强、软、弱、虚引用

3.3.2.1、整体架构

image-20221003204521352

Java技术允许使用finalize()方法在垃圾收集器将对象从内存中清除出去之前做必要的清理工作。

image-20221003204548356

java9已过时

3.3.2.2、强引用(默认支持模式)(普通对象)(都不回收(除非显示null…))

当内存不足,JVM开始垃圾回收,对于强引用的对象,就算是出现了OOM也不会对该对象进行回收,死都不收

强引用是我们最常见的普通对象引用,只要还有强引用指向一个对象,就能表明对象还“活着”,垃圾收集器不会碰这种对象。

在Java中最常见的就是强引用把一个对象赋给一个引用变量,这个引用变量就是一个强引用。

当一个对象被强引用变量引用时,它处于可达状态,它是不可能被垃圾回收机制回收的,
即使该对象以后永远都不会被用到,JVM也不会回收。因此强引用是造成Java内存泄漏的主要原因之一。

对于一个普通的对象,如果没有其他的引用关系,

  • 只要超过了引用的作用域或者
  • 显式地将相应(强)引用赋值为 null
  • 一般认为就是可以被垃圾收集的了(当然具体回收时机还是要看垃圾收集策略)。

image-20221003205608565

image-20221003205654984

显示地将myObject赋值为null

3.3.2.3、软引用(内存够,保存;不够,回收)

软引用是一种相对强引用弱化了一些的引用,需要用java.lang.ref.SoftReference类来实现,可以让对象豁免一些垃圾收集。

对于只有软引用的对象来说,

  • 当系统内存充足时它不会被回收,

  • 当系统内存不足时它会被回收。

软引用通常用在对内存敏感的程序中,

  • 比如高速缓存就有用到软引用,内存够用的时候就保留,不够用就回收!
class MyObject{

}
public class ReferenceDemo {
    public static void main(String[] args) {
        SoftReference<MyObject> softReference = new SoftReference<MyObject>(new MyObject());
        System.gc();
        try {
            TimeUnit.SECONDS.sleep(1);} catch (InterruptedException e) {e.printStackTrace();}
        System.out.println("-----gc after 内存够用"+softReference.get());
    }
}

image-20221003211455627


模拟内存不够用

设置最大内存为10m

image-20221003211455627


class MyObject{

}
public class ReferenceDemo {
    public static void main(String[] args) {
        SoftReference<MyObject> softReference = new SoftReference<MyObject>(new MyObject());
        System.gc();
        try {
            TimeUnit.SECONDS.sleep(1);} catch (InterruptedException e) {e.printStackTrace();}
        System.out.println("-----gc after 内存够用"+softReference.get());

        try {
            byte[] bytes = new byte[20 * 1024 * 1024];//20m
        }catch (Exception e){
            e.printStackTrace();
        }
        System.out.println("-----gc after 内存不够用"+softReference.get());

    }
}

image-20221003211811271


3.3.2.4、弱引用(都会回收)

弱引用需要用java.lang.ref.WeakReference类来实现,它比软引用的生存期更短,

对于只有弱引用的对象来说,只要垃圾回收机制一运行,不管JVM的内存空间是否足够,都会回收该对象占用的内存。

public class ReferenceDemo {
    public static void main(String[] args) {
        WeakReference<MyObject> weakReference = new WeakReference<>(new MyObject());
        System.out.println("-----gc after 内存够用" + weakReference.get());
        System.gc();
        try {
            TimeUnit.SECONDS.sleep(1);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println("-----gc after 内存够用" + weakReference.get());

    }
}

image-20221003214614546

3.3.2.5、软和弱的使用场景

假如有一个应用需要读取大量的本地图片:

  • 如果每次读取图片都从硬盘读取则会严重影响性能,

  • 如果一次性全部加载到内存中又可能造成内存溢出。此时使用软引用可以解决这个问题。

设计思路是:

  • 用一个HashMap来保存图片的路径和相应图片对象关联的软引用之间的映射关系,在内存不足时,JVM会自动回收这些缓存图片对象所占用的空间,从而有效地避免了OOM的问题。
Map<String, SoftReference<Bitmap>>imageCache = 
    new HashMap<String, SoftReference<Bitmap>>();
3.3.2.6、虚引用(随时回收)(事后清理)

事后清理操作

  1. 虚引用必须和引用队列(ReferenceQueue)联合使用

    虚引用需要java.lang.ref.PhantomReference类来实现,顾名思义,就是形同虚设,与其他几种引用都不同,虚引用并不会决定对象的生命周期。

    如果一个对象仅持有虚引用,那么它就和没有任何引用一样,在任何时候都可能被垃圾回收器回收,它不能单独使用也不能通过它访问对象,虚引用必须和引用队列(ReferenceQueue)联合使用。

  2. PhantomReferenceget方法总是返回null

虚引用的主要作用是跟踪对象被垃圾回收的状态。仅仅是提供了一种确保对象被finalize以后,做某些事情的

通知机制PhantomReferenceget方法总是返回null,因此无法访问对应的引用对象。

  1. 处理监控通知使用
    换句话说,设置虚引用关联对象的唯一目的,就是在这个对象被收集器回收的时候收到一个系统通知或者后续添加进一步的处理,用来实现比finalize机制更灵活的回收操作
public class ReferenceDemo {
    public static void main(String[] args) {
        MyObject myObject = new MyObject();
        ReferenceQueue<MyObject> referenceQueue = new ReferenceQueue<>();
        PhantomReference<MyObject> phantomReference =
                new PhantomReference<>(myObject, referenceQueue);

        System.out.println(phantomReference.get());//null
        List<byte[]> list = new ArrayList<>();
        new Thread(()->{
            while (true){
                list.add(new byte[1024*1024*1024]);
                try {TimeUnit.SECONDS.sleep(1);} catch (InterruptedException e) {e.printStackTrace();}
                System.out.println(phantomReference.get()+"\tlist add ok");
            }
        },"t1").start();

        new Thread(()->{
            while (true){
                Reference<? extends MyObject> reference = referenceQueue.poll();
                if (reference != null) {
                    System.out.println("-----有虚对象被回收加入了对列");
                    break;
                }
            }
        },"t2").start();
    }
}

image-20221003220801226

3.3.3、小总结

image-20221003221119149

ThreadLocal是一个壳子,真正的存储结构是ThreadLocal里有ThreadLoclMap这么个内部类,每个Thread对象维护着一个TheadLocaMap的引用,ThreadLocalMapThreadLocal的内部类,用Entry来进行存储。

  1. 调用ThreadLocalset()方法时,实际上就是往ThreadLocalMap设置值,keyThreadLocal对象,值Value是传递进来的对象

  2. 调用ThreadLocalget()方法时,实际上就是往ThreadLocalMap获取值,keyThreadLocal对象
    ThreadLocal本身并不存储值(ThreadLocal是一个壳子),它只是自己作为一个key来让线程从ThreadLocalMap获取value。正因为这个原理,所以ThreadLocal能够实现“数据隔离”,获取当前线程的局部变量值,不受其他线程影响~

3.4、为什么要用弱引用?不用如何?

line1新建了一个ThreadLocal对象,t1是强引用指向这个对象;

line2调用set()方法后新建一个Entry,通过源码可知Entry对象里的k(t1)是弱引用指向这个对象。

image-20221004222538758

3.4.1、为什么源代码用弱引用?!!

public class flag {
    public static void main(String[] args) {
        ThreadLocal<String> t1 = new ThreadLocal<>();
        t1.set("1");
        t1.get();
    }
}

functione1方法执行完毕后,栈帧销毁强引用t也就没有了。但此时线程的ThreadLocalMap里某个entrykey引用还指向这个对象

若这个key引用是强引用,就会导致key指向的ThreadLocal对象及v指向的对象不能被gc回收(因为ThreadLocal这个对象一直被map中的k强引用,导致gc一直删除不了),造成内存泄漏;

若这个key引用是弱引用ThreadLocal对象在方法执行完,gc直接回收了,导致map中的key=null)就大概率会减少内存泄漏的问题(还有一个key为null的雷,第2个坑后面讲)。

对于v 不设置为弱引用,是因为不清楚这个Value除了map的引用还是否还存在其他引用,如果存在其他引用,当GC的时候就会直接将这个Value干掉了,而此时我们的ThreadLocal还处于使用期间,就会造成Value为null的错误,所以将其设置为强引用

key使用弱引用,就可以使ThreadLocal对象在方法执行完毕后顺利被回收且Entrykey引用指向为null。

例如:

  • 人死了,身份证卡号这个信息也应该作废

3.4.1.1、坑

1当我们为threadLocal变量赋值,实际上就是当前的Enty(threadLocal实例为key,值为value)往这个threadLocalMap中存放。Entry中的key是弱引用,当threadLocal外部强引用被置为null(t1=null),那么系统GC的时候,根据可达性分析,这个threadLocal实例就没有任何一条链路能够引用到它,这个ThreadLocal势必会被回收。

这样一来,ThreadLocalMap中就会出现key为null的Entry,就没有办法访问这些key为nulI的Entry的value,如果当前线程再迟迟不结束的话(线程池复用),这些key为null的Entry的value就会一直存在一条强引用链: Thread Ref->Thread -> ThreaLocalMap >value永远无法回收,造成内存泄漏。

2当然,如果当前thread运行结束,threadLocalthreadLocalMap,Entry没有引用链可达,在垃圾回收的时候都会被系统进行回收。

3但在实际使用中我们有时候会用线程池去维护我们的线程,比如在Executors. newFixedThreadPool()时创建线程的时候,为了复用线程是不会结束的,所以threadLocal内存泄漏就值得我们小心

3.4.1.2、key为null的entry,原理分析

image-20221004224031462

ThreadLocalMap使用ThreadLocal的弱引用作为key,如果一个ThreadLocal没有外部强引用引用他,那么系统gc的时候,这个ThreadLocal势必会被回收,这样一来,ThreadLocalMap中就会出现key为nullEntry,就没有办法访问这些keynullEntryvalue,如果当前线程再迟迟不结束的话(比如正好用在线程池),这些key为null的Entry的value就会一直存在一条强引用链。

虽然弱引用,保证了key指向的ThreadLocal对象能被及时回收,但是v指向的value对象是需要ThreadLocalMap调用getset时发现keynull去回收整个entry . value

因此弱引用不能100%保证内存不泄露。我们要在不使用某个ThreadLocal对象后,手动调用remove方法来剧除它

尤其是在线程池中,不仅仅是内存泄露的问题,因为线程池中的线程是重复使用的,意味着这个线程的ThreadLocalMap对象也是重复使用的,如果我们不手动调用remove方法,那么后面的线程就有可能获取到上个线程遗留下来的value值,造成bug.

3.4.1.3、set、get方法会去检查所有key为null的Entry对象

寻找脏Entry,即key=nullEntry,然后进行删除

3.4.1.3.1、expungeStaleEntry 记住
3.4.1.3.2、set()

检查当前线程的Entry的key为不为null

image-20221004224547060

image-20221004225242113

image-20221004225329676

3.4.1.3.3、get()

检查当前线程的Entrykey为不为null

image-20221004225422305

image-20221004225439906

image-20221004225457781

3.4.1.3.5、remove() 主动删除

主动把当前线程的Entrykey置为null

image-20221004225611833

3.4.1.3.2、结论

从前面的set,getEntry,remove方法看出,在threadLocal的生命周期里,针对threadLocal存在的内存泄漏的问题,都会通过expungeStaleEntrycleanSomeSlots,replaceStaleEntry这三个方法清理掉keynull的脏entry.

.

3.5、ThreadLocal.withInitial(()-> 初始化值)

3.6、建议把ThreadLocal设置为静态

ThreadLocal能实现了线程的数据隔离,不在于它自己本身,而在于ThreadThreadLocalMap

所以,ThreadLocal可以只初始化一次,只分配一块存储空间就足以了,没必要作为成员变量多次被初始化。

3.7、用完记得手动remove

4、总结

ThreadLocal并不解决线程间共享数据的问题

ThreadLocal适用于变量在线程间隔离且在方法间共享的场景

ThreadLocal通过隐式的在不同线程内创建独立实例副本避免了实例线程安全的问题

每个线程持有一个只属于自己的专属Map并维护了ThreadLocal对象与具体实例的映射,该Map由于只被持有它的线程访问,故不存在线程安全以及锁的问题

ThreadLocalMapEntryThreadLocal的引用为弱引用,避免了ThreadLocal对象无法被回收的问题

都会通过expungeStaleEntrycleanSomeSlots,replaceStaleEntry这三个方法回收键为nullEntry对象的值(即方具体实例)以及 Entry对象本身从而防止内存泄漏,属于安全加固的方法

群雄逐鹿起纷争,人各一份天下安

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值