SimpleDateFormat 的线程安全问题
SimpleDateFormat 是一个以国别敏感的方式格式化和分析数据的具体类。 它允许格式化 (date -> text)、语法分析 (text -> date)和标准化。
但是 SimpleDateFormat 并不是一个线程安全的类,在多线程并发访问下会出现问题。通过以下代码进行检验,
public class ProveNotSafe {
static SimpleDateFormat df = new SimpleDateFormat("dd-MMM-yyyy", Locale.US);
static String testdata[] = { "01-Jan-1999", "14-Feb-2001", "31-Dec-2007" };
public static void main(String[] args) {
Runnable r[] = new Runnable[testdata.length];
for (int i = 0; i < r.length; i++) {
final int i2 = i;
r[i] = new Runnable() {
public void run() {
try {
for (int j = 0; j < 1000; j++) {
String str = testdata[i2];
String str2 = null;
/* synchronized(df) */{
Date d = df.parse(str);
str2 = df.format(d);
System.out.println("i: " + i2 + "\tj: " + j
+ "\tThreadID: "
+ Thread.currentThread().getId()
+ "\tThreadName: "
+ Thread.currentThread().getName()
+ "\t" + str + "\t" + str2);
}
if (!str.equals(str2)) {
throw new RuntimeException(
"date conversion failed after " + j
+ " iterations. Expected "
+ str + " but got " + str2);
}
}
} catch (ParseException e) {
throw new RuntimeException("parse failed");
}
}
};
new Thread(r[i]).start();
}
}
}
多次运行,便会出现异常错误:
java.lang.RuntimeException: date conversion failed after 0 iterations. Expected 01-Jan-1999 but got 28-Jul-2015
线程访问的情况大致如下图:
SimpleDateFormat 类内部有一个 Calendar 对象引用,它用来储存和这个 SimpleDateFormat 相关的日期信息,例如sdf.parse(dateStr), sdf.format(date) 诸如此类的方法参数传入的日期相关String, Date等等, 都是交给 Calendar 引用来储存的.这样就会导致一个问题,如果你的 SimpleDateFormat 是个static 的, 那么多个thread 之间就会共享这个SimpleDateFormat , 同时也是共享这个Calendar引用,那么就出现时间混乱的情况。
解决方法
(1)第一种方法,也是最简单的解决方案。我们可以把static去掉,这样每个新的线程都会有一个自己的sdf实例,从而避免线程安全的问题。
SimpleDateFormat df = new SimpleDateFormat("dd-MMM-yyyy", Locale.US);
Date d = df.parse(str);
str2 = df.format(d);
此时访问的情况如下:
然而,使用这种方法,在高并发的情况下会大量的new sdf以及销毁sdf,这样是非常耗费资源的。
(2)第二种方法,使用 ThreadLocal。
在并发情况下,网站的请求任务与线程执行情况大概可以理解为如下。
例如Tomcat的线程池的最大Thread数为4, 现在需要执行的任务有1000个(理解为有1000个用户点了你的网站的某个功能),而这1000个任务都会用到我们写的日期函数处理类
A) 假如说日期函数处理类使用的是new SimpleDateFormat的方法,那么这里就会有1000次sdf的创建和销毁
B) Java中提供了一种ThreadLocal的解决方案,它的工作方式是,每个线程只会有一个实例,也就是说我们执行完这1000个任务,总共只会实例化4个sdf.
而且,它并不会有多线程的并发问题。因为,单个线程执行任务肯定是顺序的,例如Thread #1负责执行Task #1-#250, 那么他是顺序而执行Task #1-#250,而Thread #2拥有自己的sdf实例,他也是顺序执行任务 Task #251-#500, 以此类推。
/*
*/
package org.bupt.xiaoye.chapter3;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.HashMap;
import java.util.Map;
public class DateUtil {
/** 存放不同的日期模板格式的sdf的Map */
private static ThreadLocal<Map<String, SimpleDateFormat>> sdfMap = new ThreadLocal<Map<String, SimpleDateFormat>>() {
@Override
protected Map<String, SimpleDateFormat> initialValue() {
System.out.println(Thread.currentThread().getName() + " init pattern: " + Thread.currentThread());
return new HashMap<String, SimpleDateFormat>();
}
};
/**
* 返回一个SimpleDateFormat,每个线程只会new一次pattern对应的sdf
*
* @param pattern
* @return
*/
private static SimpleDateFormat getSdf(final String pattern) {
Map<String, SimpleDateFormat> tl = sdfMap.get();
SimpleDateFormat sdf = tl.get(pattern);
if (sdf == null) {
System.out.println(Thread.currentThread().getName()+" put new sdf of pattern " + pattern + " to map");
sdf = new SimpleDateFormat(pattern);
tl.put(pattern, sdf);
}
return sdf;
}
/**
* 这样每个线程只会有一个SimpleDateFormat
*
* @param date
* @param pattern
* @return
*/
public static String format(Date date, String pattern) {
return getSdf(pattern).format(date);
}
public static Date parse(String dateStr, String pattern)
throws ParseException {
return getSdf(pattern).parse(dateStr);
}
}
这里每个线程都有以 Thread 为key的 Map表,而这个表又以pattern 为key,每一个 pattern 都有一个唯一的 SimpleDateFormat 对象。
我们通过下面代码来测试:
package org.bupt.xiaoye.chapter3;
import java.text.ParseException;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;
public class Test {
public static void main(String[] args) {
final String patten1 = "yyyy-MM-dd";
final String patten2 = "yyyy-MM";
Thread t1 = new Thread() {
@Override
public void run() {
try {
DateUtil.parse("1992-09-13", patten1);
} catch (ParseException e) {
e.printStackTrace();
}
}
};
Thread t2 = new Thread() {
@Override
public void run() {
try {
DateUtil.parse("2000-09", patten2);
} catch (ParseException e) {
e.printStackTrace();
}
}
};
Thread t3 = new Thread() {
@Override
public void run() {
try {
DateUtil.parse("1992-09-13", patten1);
} catch (ParseException e) {
e.printStackTrace();
}
}
};
Thread t4 = new Thread() {
@Override
public void run() {
try {
DateUtil.parse("2000-09", patten2);
} catch (ParseException e) {
e.printStackTrace();
}
}
};
Thread t5 = new Thread() {
@Override
public void run() {
try {
DateUtil.parse("2000-09-13", patten1);
} catch (ParseException e) {
e.printStackTrace();
}
}
};
Thread t6 = new Thread() {
@Override
public void run() {
try {
DateUtil.parse("2000-09", patten2);
} catch (ParseException e) {
e.printStackTrace();
}
}
};
System.out.println("单线程执行: ");
ExecutorService exec = Executors.newFixedThreadPool(1);
exec.execute(t1);
exec.execute(t2);
exec.execute(t3);
exec.execute(t4);
exec.execute(t5);
exec.execute(t6);
exec.shutdown();
sleep(1000);
System.out.println("双线程执行: ");
ExecutorService exec2 = Executors.newFixedThreadPool(2);
exec2.execute(t1);
exec2.execute(t2);
exec2.execute(t3);
exec2.execute(t4);
exec2.execute(t5);
exec2.execute(t6);
exec2.shutdown();
}
private static void sleep(long millSec) {
try {
TimeUnit.MILLISECONDS.sleep(millSec);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
单线程执行:
pool-1-thread-1 init pattern: Thread[pool-1-thread-1,5,main]
pool-1-thread-1 put new sdf of pattern yyyy-MM-dd to map
pool-1-thread-1 put new sdf of pattern yyyy-MM to map
双线程执行:
pool-2-thread-1 init pattern: Thread[pool-2-thread-1,5,main]
pool-2-thread-1 put new sdf of pattern yyyy-MM-dd to map
pool-2-thread-2 init pattern: Thread[pool-2-thread-2,5,main]
pool-2-thread-2 put new sdf of pattern yyyy-MM to map
pool-2-thread-1 put new sdf of pattern yyyy-MM to map
pool-2-thread-2 put new sdf of pattern yyyy-MM-dd to map
从输出我们可以看出:
1) 1个线程执行这6个任务的时候,这个线程首次使用过的时候会new一个新的sdf,并且以后都一直用这个sdf,而不是每次处理任务都新建一个新的sdf
2) 2个线程执行6个任务的时候也是同理,但是2个线程的sdf是分开的,每个线程都有自己的"yyyy-MM-dd", "yyyy-MM"的sdf,所以他们不会有线程安全安全问题
试想,如果使用的是new的实现方法,那么不管是用1个线程去执行,还是用2个线程去执行这6个任务,都需要new 6个sdf
(3)第三种方式,使用同步代码块(synchronized)或者使用装饰器设计模式包装下 SimpleDateFormat ,使之变得线程安全。
也就是在另一篇文章中介绍的 实例封闭机制。
http://blog.csdn.net/zq602316498/article/details/40143437
(4)第四种方式,使用第三方日期处理函数
比如 JODA 来避免这些问题,你也可以使用 commons-lang 包中的 FastDateFormat 工具类。
参考博文:
http://my.oschina.net/leejun2005/blog/152253
http://www.cnblogs.com/zemliu/archive/2013/08/29/3290585.html