ThreadLocal 是什么?
早在 JDK 1.2 的版本中就提供 java.lang.ThreadLocal,ThreadLocal 为解决多线程程序的并发问题提供了一种新的思路。使用这个工具类可以很简洁地编写出优美的多线程程序。
ThreadLocal 很容易让人望文生义,想当然地认为是一个“本地线程”。其实,ThreadLocal 并不是一个 Thread,而是 Thread的局部变量,也许把它命名为 ThreadLocalVariable 更容易让人理解一些。
当使用 ThreadLocal 维护变量时,ThreadLocal 为每个使用该变量的每个线程提供独立的变量副本,所以每个线程都可以独立地改变自己的副本,而不会影响其它线程所对应的副本。
从线程的角度看,目标变量就象是线程的本地变量,这也是类名中“Local”所要表达的意思。
线程局部变量并不是 Java 的新发明,很多语言(如 IBM IBM XL FORTRAN)在语法层面就提供线程局部变量。在 Java 中没有提供在语言级的支持,而是变相地通过 ThreadLocal 类来提供支持。所以,在 Java 中编写线程局部变量的代码相对来说要笨拙一些,因此造成线程局部变量没有在 Java 开发者中得到很好的普及。
ThreadLocal 类的接口方法
ThreadLocal 类的接口很简单,只有4个方法,我们先来了解一下:
public void set ((Object value)
设置当前线程的线程局部变量的值。
public Object get ()
返回当前线程所持有的线程局部变量。
public void remove()
将当前线程局部变量的值删除,目的是为了减少内存的占用,该方法是 JDK 5.0 新增的方法。需要指出的是,当线程结束后,对应该线程的局部变量将自动被垃圾回收,所以显式调用该方法清除线程的局部变量并不是必须的操作,但它可以加快内存回收的速度。
protected Object initialValue()
返回该线程局部变量的初始值,该方法是一个 protected 的方法,显然是为了让子类覆盖而设计的。这个方法是一个延迟调用方法,在线程第 1 次调用 get() 或 set(Object) 时才执行,并且仅执行 1 次。ThreadLocal 中的缺省实现直接返回一个null。
值得一提的是,在 JDK5.0 中,ThreadLocal 已经支持泛型,该类的类名已经变为 ThreadLocal<T>。API 方法也相应进行了调整,新版本的 API 方法分别是 public void set(T value)、public T get() 以及 protected T initialValue()。
ThreadLocal 是如何做到为每一个线程维护变量的副本呢?其实实现的思路很简单:在 ThreadLocal 类中有一个 Map,用于存储每一个线程的变量副本,Map 中元素的键为线程对象,而值对应线程的变量副本。
我们自己就可以提供一个简单的实现版本:
public class SimpleThreadLocal {
private Map valueMap = Collections.synchronizedMap(new HashMap());
public void set(Object newValue) {
// ① 键为线程对象,值为本线程的变量副本
valueMap.put(Thread.currentThread(), newValue);
}
public Object get() {
Thread currentThread = Thread.currentThread();
// ② 返回本线程对应的变量
Object o = valueMap.get(currentThread);
// ③ 如果在 Map 中不存在,放到 Map 中保存起来。
if (o == null && !valueMap.containsKey(currentThread)) {
o = initialValue();
valueMap.put(currentThread, o);
}
return o;
}
public void remove() {
valueMap.remove(Thread.currentThread());
}
public Object initialValue() {
return null;
}
}
虽然这个 ThreadLocal 的实现版本显得比较幼稚,但它和 JDK 所提供的 ThreadLocal 类在实现思路上是相近的。
一个 TheadLocal 实例
下面,我们通过一个具体的实例了解一下 ThreadLocal 的具体使用方法。
public class SequenceNumber {
// ① 通过匿名内部类覆盖 ThreadLocal 的 initialValue() 方法,指定初始值
private static ThreadLocal seqNum = new ThreadLocal() {
public Integer initialValue() {
return 0;
}
};
// ② 获取下一个序列值
public int getNextNum(){
seqNum.set(seqNum.get() + 1);
return seqNum.get();
}
public static void main(String[] args) {
SequenceNumber sn = new SequenceNumber();
// ③ 3个线程共享 sn,各自产生序列号
TestClient t1 = new TestClient(sn);
TestClient t2 = new TestClient(sn);
TestClient t3 = new TestClient(sn);
t1.start();
t2.start();
t3.start();
}
private static class TestClient extends Thread {
private SequenceNumber sn;
public TestClient(SequenceNumber sn) {
this.sn = sn;
}
public void run() {
// ④ 每个线程打出3个序列值
for (int i = 0; i < 3; i++) {
System.out.println("thread["+Thread.currentThread().getName()+"] sn ["+sn.getNextNum()+"]");
}
}
}
}
通常我们通过匿名内部类的方式定义 ThreadLocal 的子类,提供初始的变量值,如例子中 ① 处所示。TestClient 线程产生一组序列号,在 ③ 处,我们生成 3 个 TestClient,它们共享同一个 SequenceNumber 实例。
运行以上代码,在控制台上输出以下的结果:
thread[Thread-2] sn[1]
thread[Thread-0] sn[1]
thread[Thread-1] sn[1]
thread[Thread-2] sn[2]
thread[Thread-0] sn[2]
thread[Thread-1] sn[2]
thread[Thread-2] sn[3]
thread[Thread-0] sn[3]
thread[Thread-1] sn[3]
考察输出的结果信息,我们发现每个线程所产生的序号虽然都共享同一个SequenceNumber实例,但它们并没有发生相互干扰的情况,而是各自产生独立的序列号,这是因为我们通过ThreadLocal为每一个线程提供了单独的副本。
Thread 同步机制的比较
ThreadLocal 和线程同步机制相比有什么优势呢?
ThreadLocal 和线程同步机制都是为了解决多线程中相同变量的访问冲突问题。
在同步机制中,通过对象的锁机制保证同一时间只有一个线程访问变量。这时该变量是多个线程共享的,使用同步机制要求程序慎密地分析什么时候对变量进行读写,什么时候需要锁定某个对象,什么时候释放对象锁等繁杂的问题,程序设计和编写难度相对较大。
而 ThreadLocal 则从另一个角度来解决多线程的并发访问。ThreadLocal 会为每一个线程提供一个独立的变量副本,从而隔离了多个线程对数据的访问冲突。因为每一个线程都拥有自己的变量副本,从而也就没有必要对该变量进行同步了。ThreadLocal 提供了线程安全的共享对象,在编写多线程代码时,可以把不安全的变量封装进 ThreadLocal。
由于 ThreadLocal 中可以持有任何类型的对象,低版本 JDK 所提供的 get() 返回的是 Object 对象,需要强制类型转换。但 JDK 5.0 通过泛型很好地解决了这个问题,在一定程度地简化了 ThreadLocal 的使用,上例的代码中就使用了 JDK 5.0 新的 ThreadLocal<T> 版本。
概括起来说,对于多线程资源共享的问题,同步机制采用了“以时间换空间”的方式,而 ThreadLocal 采用了“以空间换时间”的方式。前者仅提供一份变量,让不同的线程排队访问,而后者为每一个线程都提供了一份变量,因此可以同时访问而互不影响。
Spring 使用 ThreadLocal 解决线程安全问题
我们知道在一般情况下,只有无状态的 Bean 才可以在多线程环境下共享,在 Spring 中,绝大部分 Bean 都可以声明为 singleton 作用域。就是因为 Spring 对一些 Bean(如 RequestContextHolder、TransactionSynchronizationManager、LocaleContextHolder 等)中非线程安全状态采用 ThreadLocal 进行处理,让它们也成为线程安全的状态,因为有状态的 Bean 就可以在多线程中共享了。
一般的 Web 应用划分为展现层、服务层和持久层三个层次,在不同的层中编写对应的逻辑,下层通过接口向上层开放功能调用。在一般情况下,从接收请求到返回响应所经过的所有程序调用都同属于一个线程,如图所示:
同一线程贯通三层
这样你就可以根据需要,将一些非线程安全的变量以 ThreadLocal 存放,在同一次请求响应的调用线程中,所有关联的对象引用到的都是同一个变量。
下面的实例能够体现 Spring 对有状态 Bean 的改造思路:
public class TopicDao {
// ① 一个非线程安全的变量
private Connection conn;
public void addTopic() {
// ② 引用非线程安全变量
Statement stat = conn.createStatement();
…
}
}
由于 ① 处的 conn 是成员变量,因为 addTopic() 方法是非线程安全的,必须在使用时创建一个新 TopicDao 实例(非 singleton)。下面使用 ThreadLocal 对conn 这个非线程安全的“状态”进行改造:
import java.sql.Connection;
import java.sql.Statement;
public class TopicDao {
// ① 使用 ThreadLocal 保存 Connection 变量
private static ThreadLocal connThreadLocal = new ThreadLocal();
public static Connection getConnection() {
// ② 如果 connThreadLocal 没有本线程对应的 Connection 创建一个新的 Connection,
//并将其保存到线程本地变量中。
if (connThreadLocal.get() == null) {
Connection conn = ConnectionManager.getConnection();
connThreadLocal.set(conn);
return conn;
} else {
// ③ 直接返回线程本地变量
return connThreadLocal.get();
}
}
public void addTopic() {
// ④ 从 ThreadLocal 中获取线程对应的 Connection
Statement stat = getConnection().createStatement();
}
}
不同的线程在使用 TopicDao 时,先判断 connThreadLocal.get() 是否是 null,如果是 null,则说明当前线程还没有对应的 Connection 对象,这时创建一个Connection 对象并添加到本地线程变量中;如果不为 null,则说明当前的线程已经拥有了 Connection 对象,直接使用就可以了。这样,就保证了不同的线程使用线程相关的 Connection,而不会使用其它线程的 Connection。因此,这个 TopicDao 就可以做到 singleton 共享了。
当然,这个例子本身很粗糙,将 Connection 的 ThreadLocal 直接放在 DAO 只能做到本 DAO 的多个方法共享 Connection 时不发生线程安全问题,但无法和其它 DAO 共用同一个 Connection,要做到同一事务多 DAO 共享同一 Connection,必须在一个共同的外部类使用 ThreadLocal 保存 Connection。
小结
ThreadLocal 是解决线程安全问题一个很好的思路,它通过为每个线程提供一个独立的变量副本解决了变量并发访问的冲突问题。在很多情况下,ThreadLocal 比直接使用 synchronized 同步机制解决线程安全问题更简单、更方便,且结果程序拥有更高的并发性。
转载自:
http://blog.jobbole.com/20400/