阿里后端面试: 说说你对ThreadLocal的理解, ThreadLocal如何避免内存泄漏?_ThreadLocal

介绍

  • 每个Thread对象, 内部有一个ThreadLocalMap threadLocals, 这是一个哈希表, 底层是一个Node[ ] table;
  • 当在某个线程中调用ThreadLocal的set方法时, 会使用Thread.currentThread获取当前先线程的thread对象, 然后将ThreadLocal对象作为key, 将set方法的参数作为value, 构建一个Entry, 将此Entry保存到thead对象的ThreadLocalMap中;
  • 注意, Entry继承了WeakReference, 在构造方法中, 将ThreadLocal对象传给了WeakReference构造方法, 也就是说ThreadLocalMap中的ThreadLocal作为key, 是被弱引用指向的;
  • 这样做, 能保证在主程序中ThreadLocal的引用被置为null后, 对应的threadLocal对象就会被回收, 防止内存泄漏.
  • 但是仅仅这样, 还不能防止内存泄漏, ThreadLocal被回收以后, key的值变为null, 但是value还没被回收, 并且value一直有强引用指向; 所以需要调用remove方法, 删除整个Entry;

内存泄漏: 已经不再使用的对象仍然被持有引用,导致垃圾回收器无法回收这些对象的内存,从而导致内存无法释放,逐渐耗尽可用内存。我们在程序中, 应该尽量避免静态的大对象, 避免资源使用不释放, 例如输入输出流

例子

  1. 考虑一个SpringBoot 后端应用;
  2. 用户的请求里携带了用户的ID, 我希望在各种不同的地方都能方便地拿到这个Id, 比如在各个Controller里;
  3. 如果每次都去 Request 中取, 有点麻烦, 我希望能把这个值存起来;
  4. 做一个Filter, 里面设置一个静态变量, 请求来到的时候, 用这个静态变量来保存用户Id; 以后我直接用 Filter.id 就能拿到了;
  5. 单线程没问题, 多线程的情况下, 明显有问题: 不同的线程处理不同的请求都会使用同一个 filter 对象, 导致一会存的是这个请求中的userId, 一会又是另一个请求中的userId;
  6. 这时候, 就可以在 Filter 里设置一个 static ThreadLocal<UserID>
  7. 假设当前有两个线程; 线程 A 在 Filter 的时候调用 threadLocal.set, 把用户A的Id 保存到了自己 ThreadLocalMap;
// 伪代码
 static ThreadLocal<Integer> id = new ThreadLocal<>();
 id.set(request.getUserId);
 chain.doFilter();
 id.remove();
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  1. 线程B同理, 把用户B 的 Id 保存到了自己的 TheadLocalMap;
  2. 虽然不同线程用了同一个threadLocal对象作为key, 但 ThreadLocalMap 和 value 是各个线程自己的;
  3. 不同的线程使用相同的 threadLocal对象去 get, 拿到的是当前线程独有的 value;
  4. 在其他地方就可以通过 Filter.threadLocal.get 去获取本线程的用户Id;
  5. 不过需要在用完了以后及时回收; 比如在 Filter 里面请求返回的时候调用 threadLocal.remove, 把这次的键值对删除;
  6. 否则这个线程被分给下个请求的时候, 上个请求的键值对还在; 不过在这个场景下, 不 remove 并不会对内存产生太大危害, 这里 remove 是防止后面的请求查到上一个请求的数据;

下个请求调用 threadLocal.set的时候, 用的还是同一个 threadLocal对象, 新的 Value 会覆盖旧的Value, 旧的Value没有引用指向就回收了

  1. 内存泄漏主要是考虑到线程长时间存在, 并且运行过程中不断往ThreadLocalMap 里加不同的 ThreadLocal; 如果只有若干个静态的ThreadLocal的话, 其实没啥问题;
  2. 为什么不直接让用户自己插入键值对到 ThreadLocalMap? 因为自动帮你做了一个 WeakReference;

初始化

  1. 初始时, 一个Thread对象的ThreadLocalMap threadLocals对象为null, 在该线程中首次调用threadLocal.set或get方法时, 会创建一个Capacity为16的哈希表, 装填因子为2 / 3;
  2. 如果时threadLocal.get方法触发的创建, 则会放入一个<threadLocal, null>的键值对
  3. 如果以set方法触发创建, 则放入的是<threadLocal, set方法的参数>

冲突解决

  1. 和HashMap不同, 使用的是线性探查法, 添加一个Entry时, 如果冲突, 则向后(循环)寻找到第一个null位置, 放到该位置;

ThreadLocal.set

  1. 计算应该放到的下标, 开始线性探查, 如果过程中遇到key==的结点, 进行value替换
  2. 如果探查到一个位置为null, 则放入新的Entry;
private void set(ThreadLocal<?> key, Object value) {
     Entry[] tab = table;
     int len = tab.length;
     int i = key.threadLocalHashCode & (len-1); // 获取下标
     // 线性探查
     for (Entry e = tab[i];
          e != null;
          e = tab[i = nextIndex(i, len)]) {
         ThreadLocal<?> k = e.get();
         // 找到一个key相 == 的进行value替换, return
         if (k == key) {
             e.value = value;
             return;
         }
         // 如果过程中遇到一个Entry, 其弱引用已经被释放, 那么进行一些清除和rehash的工作, 并替换这个Entry, 返回
         if (k == null) {
             /**
             1.这个方法不需要看懂每一行
             2.先向前寻找Entry != null 但 key为 null 的元素, 如果遇到 entry == null, 停止
             3.如果向前一个都没找到, 尝试向后寻找, 记录下标;
             4.替换弱引用已经被释放的这个位置
             5.根据记录的下标, 清除一些key == null的结点
                 1.从记录的下标向后遍历, 遇到的key == null的就清除这个entry, 遇到key != null的尝试重新用线性探查rehash
                 2.遇到entry == null 就停止, 不追求全部处理一遍, 处理一部分就好, 因为每次set都会做
             */
             replaceStaleEntry(key, value, i);
             return;
         }
     }
     // 找到null位置
     tab[i] = new Entry(key, value);
     // 更新size
     int sz = ++size;
     // 进行清除, 重新hash, 扩容检查
     if (!cleanSomeSlots(i, sz) && sz >= threshold)
         rehash();
 }
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.

流程总结:
ThreadLocal的set方法获取currentThread, 拿到currentThread的ThreadLocalMap, 调用这个Map的set方法

ThreadLocal.get

  1. 线性探查
private Entry getEntry(ThreadLocal<?> key) {
     int i = key.threadLocalHashCode & (table.length - 1);
     Entry e = table[i];
     if (e != null && e.get() == key)
         return e;
     else
     // 线性探查法继续向后寻找, 找到第一个null的位置时, 说明不存在, 返回null               
     return getEntryAfterMiss(key, i, e);
 }
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.

流程总结:
ThreadLocal的get方法获取currentThread, 拿到其threadLocals, 调用它的getEntry方法, 如果getEntry找到了对应的key, 返回对应的value; 如果getEntry返回null, 没找到, 那么将<threadLocal, null>放入ThreadLocalMap, 并返回null;

扩容

  1. size >= threshold时扩容
  2. 容量 * 2; 对以前的元素重新hash;

防止内存泄漏

  • 两重保险, 一个是弱引用, 一个是remove
  • 手动remove, 会直接清除掉整个Entry, table[i] = null;
  • 如果没有remove, 但是threadLocal的强引用改为null了, 那么ThreadLocalMap中的弱引用不会阻值垃圾回收, threadLocal对象将被回收, ThreadLocalMap中对应的Entry的key指向null;
  • 后续调用ThreadLocalMap的set方法时, 每次都会清除一部分 key == null 的Entry;
  • 面试题: 为什么value不设置为弱引用? 一是不能, 二是没必要
  1. 如果value也是弱引用, 可能出现key还在, value已经被回收的情况, 这样通过get方法就会获取到错误的value;
  2. 因为调用threadLocal.set时, 进一步调用到ThreadLocalMap的set方法, 会对key == null 的Entry进行清除工作, 这样value也就一并被清除了;
  3. 提供了remove方法, remove以后把整个Entry都清除了;
  •  面试题: 既然弱引用指向的对象一发生gc就被回收, 我怎么保证用到 threadLocal 对象的时候它还在?

陷阱, "弱引用指向的对象一发生gc就被回收"是错误的; 当一个对象没有强引用指向, 只有弱引用或虚引用指向的时候, gc 才会回收它;