ThreadLocal源码分析

1.ThreadLocal 是什么

Threadlocal 是 jdk 中一个非常重要的工作类。它是线程本地存储,可以保证各个线程之间的变量互不干扰。

它的数据结构:

ThreadLocalMap有点类似HashMap的结构,只是HashMap是由数组+链表实现的,而ThreadLocalMap中并没有链表结构。

注意Entry, 它的key是继承自WeakReference, 是弱引用类型,在 GC 时,key 有可能会被回收掉。

2.ThreadLocal 的方法

2.1 set()

点进去 set() 方法,源码如下:

public void set(T value) {
    // 获取当前线程
    Thread t = Thread.currentThread();
    // 获取当前线程的ThreadLocalMap
    ThreadLocal.ThreadLocalMap map = getMap(t);
    // 如果map存在就存储value,不存在先创建map,再设置value
    if (map != null)
        map.set(this, value);
    else
        createMap(t, value);
}

第一步就是获取当前线程,然后拿到当前线程的 ThreadLocalMap,数据就是存在这个ThreadLocalMap 中。

createMap() 的源码很简单,作用是初始化ThreadLocalMap,并添加第一个元素,元素的key为当前ThreadLocal对象,源码如下:

void createMap(Thread t, T firstValue) {
    // 初始化ThreadLocalMap,并添加第一个元素,元素的key为当前ThreadLocal对象
    t.threadLocals = new ThreadLocal.ThreadLocalMap(this, firstValue);
}

继续看初始化ThreadLocalMap的源码:

ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
    // 初始化entry数组,初始大小INITIAL_CAPACITY=16
    table = new Entry[INITIAL_CAPACITY];
    // 计算ThreadLocal对象的hash,用作下标
    int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
    // 把第一个元素的放在计算出来的下标上
    table[i] = new Entry(firstKey, firstValue);
    size = 1;
    // 设置Threshold为初始大小,Threshold是用来扩容的
    setThreshold(INITIAL_CAPACITY);
}

以上是 ThreadLocalMap 为 null 的逻辑。重点逻辑在 ThreadLocalMap 不为空时,执行的 set() 方法。源码如下:

private void set(ThreadLocal<?> key, Object value) {

    Entry[] tab = table;
    int len = tab.length;
    // 计算hash,作为数组下标
    int i = key.threadLocalHashCode & (len-1);

    // 从下标i开始遍历entry数组,直到元素为null停止遍历
    // nextIndex就是把i++,如果i等于数组长度,那么i重新设置0
    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        // 获取key,key是弱引用,可能是null
        ThreadLocal<?> k = e.get();
        // 如果k等于key(==是判断内存地址),那么把value更新一下
        if (k == key) {
            e.value = value;
            return;
        }
        // 如果key是null,那么替换过期的key
        if (k == null) {
            replaceStaleEntry(key, value, i);
            return;
        }
    }
    // 如果for循环没有进去,也就是数组下标i的元素是null,
    // 那么该下标填充一个新的entry
    tab[i] = new Entry(key, value);
    int sz = ++size;
    // 如果没有清理数据,并且数组长度大于等于threshold
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        // 判断是否需要扩容
        rehash();
}

在该方法中,先计算 hash 作为 entry 数组下标,此时:

  • 如果该下标不存在元素,那么直接设置值。
  • 如果该下标存在元素,并且下标元素的 key 和传递的 key 一样,那么覆盖之前的 value。
  • 如果该下标存在元素,并且下标元素的 key 为 null,那么这个 entry 是一个过期的 entry,因为 entry 的 key 被GC回收了。这时会替换这个位置的 entry。
  • 如果该下标存在元素,并且下标元素的 key 和传递的 key 不一样也不为 null,那么从当前下标继续向后寻找可以存在该元素的地方。

在最后,如果 cleanSomeSlots() 返回 false(没有清理到数据),并且 size 大于等于 threshold,那么会执行 rehash(),来判断是否需要扩容。

replaceStaleEntry(),这个方法会替换过期数据的逻辑,源码:

private void replaceStaleEntry(ThreadLocal<?> key, Object value,
                               int staleSlot) {
    Entry[] tab = table;
    int len = tab.length;
    Entry e;

    // 开始扫描的起点,初始值和过期元素的下标相等
    int slotToExpunge = staleSlot;
    // 从传递的下标(不包含)开始向前遍历,直到元素为null停止
    for (int i = prevIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = prevIndex(i, len))
        // 目的在于确定slotToExpunge的值
        if (e.get() == null)
            slotToExpunge = i;

    // 从传递的下标(不包含)开始向后遍历,直到元素为null停止
    // 这个循环做两件事:1.确定开始清理数据的起点slotToExpunge;2.更新相同key的entry
    for (int i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
        // 获取entry的key
        ThreadLocal<?> k = e.get();

        // 遇到entry的key和传递进来key相等,就覆盖entry的value
        if (k == key) {
            // 新的value替换老的value
            e.value = value;
            // 把过期元素和当前下标的元素交换位置
            // 从这里可以看出,并不是直接替换过期entry,而是从过期entry下标向后找到一个key相同的entry
            // 然后更新key相同的entry,再把更新后entry和过期entry交换位置。
            // 自我猜测一下,这么做是想确定slotToExpunge的值,以此来更好的开展清理数据的工作
            tab[i] = tab[staleSlot];
            tab[staleSlot] = e;
            // 如果向前扫描是没有设置slotToExpunge,那么把slotToExpunge设置为i
            if (slotToExpunge == staleSlot)
                slotToExpunge = i;
            // 先从slotToExpunge开始探测式清理,然后再进行启发式清理
            cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
            // 替换过期元素结束后,结束循环
            return;
        }

        // 如果向前扫描是没有设置slotToExpunge,那么此时把遇到的第一个过期数据的下标设置为slotToExpunge
        if (k == null && slotToExpunge == staleSlot)
            slotToExpunge = i;
    }

    // 如果始终找不到过期元素,那就创建新的元素放到过期下标的位置上
    tab[staleSlot].value = null;
    tab[staleSlot] = new Entry(key, value);

    // slotToExpunge不等于staleSlot,意味着之前找到了其他过期entry,那么开始从slotToExpunge清理过期数据
    if (slotToExpunge != staleSlot)
        cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
}

仔细看 replaceStaleEntry() 会发现,在替换过期 entry 时候,不仅替换过期 entry,也把 entry 数组给清理了一遍。

清理过期 entry 的方法是 cleanSomeSlots() 和 expungeStaleEntry(),接着看下两个方法的源码:

cleanSomeSlots():

private boolean cleanSomeSlots(int i, int n) {
    boolean removed = false;
    Entry[] tab = table;
    int len = tab.length;
    // 循环清理过期数据,启发式清理
    do {
        // 获取i后面的一个下标
        i = nextIndex(i, len);
        Entry e = tab[i];
        // 如果元素不等于null并且key已经被GC回收
        if (e != null && e.get() == null) {
            n = len;
            removed = true;
            // 把过期数据清理掉,探测式清理,从当前脏entry会再往后寻找脏entry进行清理,碰到null时结束。
            i = expungeStaleEntry(i);
        }
    }
    // n >>>= 1 说明要循环log2(n)次。
    // 这个官方说不调用n次来清除,为了效率,而且经过测试调用log(n)次清除无效的数据的效果已经很好了。
    while ( (n >>>= 1) != 0);
    return removed;
}

官方释义:启发式清理。内部逻辑是一个 while 循环,循环次数是 log2(n) 次,方法的返回值含义为是否清理过。

expungeStaleEntry():

private int expungeStaleEntry(int staleSlot) {
    Entry[] tab = table;
    int len = tab.length;

    // 清理过期的key
    tab[staleSlot].value = null;
    tab[staleSlot] = null;
    size--;

    // 开始清理其他过期的key,探测式清理
    Entry e;
    int i;
    // 从入参staleSlot往后开始遍历清理,直到元素为null停止
    for (i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
        // 获取弱引用key
        ThreadLocal<?> k = e.get();
        // key为null那么把这个下标元素设置为null
        if (k == null) {
            e.value = null;
            tab[i] = null;
            size--;
        } else {
            // key不为null
            // 重新计算hash
            int h = k.threadLocalHashCode & (len - 1);
            // 如果新的hash不等于目前的下标(产生了hash冲突),那么就把当前下标元素设置为null
            if (h != i) {
                tab[i] = null;

                // 从h开始向后找一个为null的下标元素
                while (tab[h] != null)
                    h = nextIndex(h, len);
                // 找到了。把e设置到这个新的位置上。注意:这里的下标和key计算的hash可能并不相等
                tab[h] = e;
            }
        }
    }
    return i;
}

官方释义:探测式清理。它会把入参作为起点一直向后遍历清理过期数据,遇到null元素停止,然后把null元素的下标返回。

再次回到前面的 set(),当把过期 entry 替换后,会再次执行一次 cleanSomeSlots() 方法来清理数据,如果 cleanSomeSlots() 返回 false,那就表明没有清理到任何过期 entry。这时会判断 size 是否已经大于等于 threshold。如果上述的条件成立了,会执行 rehash(),看看是否需要进行扩容。

rehash():

private void rehash() {
    // 再次清理一次entry数组
    expungeStaleEntries();

    // 此时如果size依旧大于等于 threshold*3/4,就进行扩容
    if (size >= threshold - threshold / 4)
        resize();
}

在方法中,第一步先整体再次清理一次过期 entry,如果清理后,size依旧大于等于 threshold*3/4,就会进行扩容。

expungeStaleEntries():

private void expungeStaleEntries() {
    Entry[] tab = table;
    int len = tab.length;
    // 遍历整个entry数组
    for (int j = 0; j < len; j++) {
        Entry e = tab[j];
        // 如果entry不为null并且key被GC回收了,就从当前下标开始进行一次探测式清理
        if (e != null && e.get() == null)
            expungeStaleEntry(j);
    }
}

expungeStaleEntries() 会遍历整个 entry 数组,每遇到一个过期的 entry,就会从这个 entry 的位置进行一次探测式清理。

resize():

private void resize() {
    Entry[] oldTab = table;
    int oldLen = oldTab.length;
    // 扩容为2倍
    int newLen = oldLen * 2;
    Entry[] newTab = new Entry[newLen];
    // 设置元素的次数,等于size
    int count = 0;
    // 从0开始循环遍历
    for (int j = 0; j < oldLen; ++j) {
        Entry e = oldTab[j];
        // 如果元素不等于null
        if (e != null) {
            ThreadLocal<?> k = e.get();
            // 如果key不存在,即entry过期了,把value设置为null,帮助GC回收
            if (k == null) {
                e.value = null;
            } else {
                // 计算新的hash,作为下标
                int h = k.threadLocalHashCode & (newLen - 1);
                // 如果新的下标存在元素(hash冲突),那就向后寻找一个元素为null的下标
                while (newTab[h] != null)
                    h = nextIndex(h, newLen);
                // 设置元素
                newTab[h] = e;
                count++;
            }
        }
    }
    // 设置Threshold,注意这不是简单的 set 方法,内部会乘以2/3的
    setThreshold(newLen);
    size = count;
    table = newTab;
}

resize() 是扩容方法。长度扩容为之前的两倍,会把 Threshold 重新设置。

2.2 get()

get() 会从 ThreadLocal 中读取之前 set 的数据。它会以当前 ThreadLocal 为 key,去 ThreadLocalMap 中寻找数据。

get():

public T get() {
    // 获取当前线程的ThreadLocalMap
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null) {
        // 把当前ThreadLocal作为key,获取map中的entry
        ThreadLocalMap.Entry e = map.getEntry(this);
        if (e != null) {
            // 获取entry的value,然后返回value
            T result = (T)e.value;
            return result;
        }
    }
    // map为null就返回null
    return setInitialValue();
}

第一步会获取当前线程的 ThreadLocalMap,然后把当前 ThreadLocal 作为 key 去ThreadLocalMap 中寻找数据,如果找不到就返回 null。获取数据调用的是 getEntry()。

getEntry():

private Entry getEntry(ThreadLocal<?> key) {
    // 计算key的hash作为下标
    int i = key.threadLocalHashCode & (table.length - 1);
    Entry e = table[i];
    // 判断这个下标的entry是否存在,存在的话key是不是和目标key一致
    if (e != null && e.get() == key)
        // 条件都符合,返回这个entry
        return e;
    else
        // 从计算出的下标开始,向后寻找目标entry
        return getEntryAfterMiss(key, i, e);
}

根据 key 计算下标,如果这个下标的 entry 存在并且 entry 的 key 也没有被 GC 回收,那就命中这个 entry 返回。否则的话,调用 getEntryAfterMiss(),循环在 entry 数组中寻找目标 entry。

getEntryAfterMiss():

private Entry getEntryAfterMiss(ThreadLocal<?> key, int i, Entry e) {
    Entry[] tab = table;
    int len = tab.length;

    // 循环遍历,直到entry为null
    while (e != null) {
        ThreadLocal<?> k = e.get();
        // key和目标key相同,直接返回这个entry
        if (k == key)
            return e;
        // k等于null,表明这个entry为过期数据,那就进行一次探测式清理
        if (k == null)
            expungeStaleEntry(i);
        else
            i = nextIndex(i, len);
        // 没有找到目标entry,向后继续寻找
        e = tab[i];
    }
    // 怎么都找不到就返回null
    return null;
}

循环遍历 entry 数组,发现过期数据就探测式清理一次数据,返回目标 entry 就命中返回。

2.3 remove()

remove(),移除数据。

public void remove() {
    // 获取当前线程的ThreadLocalMap
    ThreadLocalMap m = getMap(Thread.currentThread());
    if (m != null)
        // 把当前ThreadLocal对象作为key,在ThreadLocalMap中移除这个key
        m.remove(this);
}

第一步获取当前线程的 ThreadLocalMap,第二步把当前 ThreadLocal 对象作为 key,在ThreadLocalMap 中移除掉。

再看 m.remove(this) 的源码:

private void remove(ThreadLocal<?> key) {
    Entry[] tab = table;
    int len = tab.length;
    // 计算hash作为下标
    int i = key.threadLocalHashCode & (len-1);
    // 从i开始遍历数组,遇到null停止遍历
    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        // 如果entry的key等于入目标key,清理entry,并进行一次探测式清理
        if (e.get() == key) {
            // 会把entry的key设置为null,这时entry就会变成过期数据
            e.clear();
            expungeStaleEntry(i);
            return;
        }
    }
}

计算出 key 的 hash 作为下标,然后从i开始遍历数组,遇到null停止遍历。在遍历时,如果命中了key,那就会执行 clear() 把命中的 entry 的 key 设置为 null。这是这个 entry 就是过期数据了,然后紧接着执行 expungeStaleEntry(),会清理掉过期的 entry。

3. 相关问题

问:ThreadLocal 中 key 为什么要使用用弱引用?value使用强引用?

答:在数据使用完毕后,继续放在 ThreadLocalMap 已经没有意义,所以程序可以主动让数据在GC是被回收掉。但是直接把 entry 设置成弱引用不合理,因为 vlaue 是用户传递进来的,value 可能在其他地方存在引用。

value 不设置为弱引用是因为不清楚除了 ThreadLocal 引用之外是否还有其他的的引用

问:ThreadLocal会有内存泄露吗?

答:存在。因为 value 是强引用,不会被GC回收,而 ThreadLocal 自动清理数据是在调用 set()、get()、remove() 是进行的,如果长时间不调用 set(),get(),remove() 方法,会有内存泄露的风向。

问:ThreadLocal为什么不用链表?

答:个人觉得,key 是会被 GC 回收的,那么这 ThreadLocalMap 中的数据存在时间并不是很稳固,可能随时被GC回收。因此没必要在使用链表来优化性能了。

问:ThreadLocal什么时候扩容?

答:在 set() 时,先判断 size 是否大于 threshold,如果是的话,清理一次 entry 数组,然后再判断一次 size 是否大于 threshold3/4。如果这时依旧成立,那么进行扩容。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
ThreadLocal源码Java中一个关键的类,它提供了一种在多线程环境下实现线程本地变量的机制。在JDK 8之前和之后,ThreadLocal的内部结构有所变化。ThreadLocal源码分为两部分:ThreadLocal类和ThreadLocalMap类。 ThreadLocal类是一个泛型类,它包含了两个核心方法:set()和get()。set()方法用于将一个值与当前线程关联起来,get()方法用于获取当前线程关联的值。 ThreadLocalMap类是ThreadLocal的内部类,它用于存储每个线程的本地变量。在JDK 8之前,ThreadLocalMap是通过线性探测法解决哈希冲突的,每个ThreadLocal对象都对应一个Entry对象,Entry对象包含了ThreadLocal对象和与之关联的值[2]。 在JDK 8之后,ThreadLocalMap的实现方式发生了改变。使用了类似于HashMap的方式,采用了分段锁的机制来提高并发性能。每个线程维护一个ThreadLocalMap对象,其中的Entry对象也是采用链表的形式来解决哈希冲突。 总结起来,ThreadLocal源码主要由ThreadLocal类和ThreadLocalMap类组成。ThreadLocal类提供了set()和get()方法来管理线程本地变量,而ThreadLocalMap类则负责存储每个线程的本地变量,并解决哈希冲突的问题。 史上最全ThreadLocal 详解 ThreadLocal源码分析_02 内核(ThreadLocalMap) 【JDK源码】线程系列之ThreadLocal 深挖ThreadLocal ThreadLocal原理及内存泄露预防 ThreadLocal原理详解——终于弄明白了ThreadLocal ThreadLocal使用与原理 史上最全ThreadLocal 详解。 ThreadLocal源码分析,主要有ThreadLocal源码以及ThreadLocal的内部结构在jdk8前后的变化。 使用方式非常简单,核心就两个方法set/get public class TestThreadLocal { private static final ThreadLocal<String> threadLocal = new ThreadLocal<>(); public static void main(String[] args) { new Thread(new Runnable() { @Override public void run() { try { threadLocal.set("aaa"); Thread.sleep(500); System.out.println("threadA:" threadLocal.get()); } catch (InterruptedException e) { e.printStackTrace(); } } }).start(); new Thread(new Runnable() { @Override public void run() { threadLocal.set("bbb"); System.out.println("threadB:" threadLocal.get()); } }).start(); } }

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值