本文转载自 http://www.barryzhang.com/archives/521
感谢原创作者 BarryZhang
1. 前言
单例(Singleton)应该是开发者们最熟悉的设计模式了,并且好像也是最容易实现的——基本上每个开发者都能够随手写出——但是,真的是这样吗?
作为一个 Java 开发者,也许你觉得自己对单例模式的了解已经足够多了。我并不想危言耸听说一定还有你不知道的——毕竟我自己的了解也的确有限,但究竟你自己了解的程度到底怎样呢?往下看,我们一起来聊聊看~
2. 什么是单例?
单例对象的类必须保证只有一个实例存在——这是维基百科上对单例的定义,这也可以作为对意图实现单例模式的代码进行检验的标准。
对单例的实现可以分为两大类——懒汉式和饿汉式,他们的区别在于:
- 懒汉式:指全局的单例实例在第一次被使用时构建。
- 饿汉式:指全局的单例实例在类装载时构建。
从它们的区别也能看出来,日常我们使用的较多的应该是懒汉式的单例,毕竟按需加载才能做到资源的最大化利用嘛~
3. 懒汉式单例
先来看一下懒汉式单例的实现方式。
3.1 简单版本
看最简单的写法 Version 1:
// Version 1
public class Single1 {
private static Single1 instance;
public static Single1 getInstance() {
if (instance == null) {
instance = new Single1();
}
return instance;
}
}
或者再进一步,把构造器改为私有的,这样能够防止被外部的类调用。
// Version 1.1
public class Single1 {
private static Single1 instance;
private Single1() {}
public static Single1 getInstance() {
if (instance == null) {
instance = new Single1();
}
return instance;
}
}
我仿佛记得当初学校的教科书就是这么教的?—— 每次获取 instance
之前先进行判断,如果 instance 为空就 new 一个出来,否则就直接返回已存在的 instance。
这种写法在大多数的时候也是没问题的。问题在于,当多线程工作的时候,如果有多个线程同时运行到 if (instance == null),都判断为 null,那么两个线程就各自会创建一个实例——这样一来,就不是单例了。
3.2 synchronized版本
那既然可能会因为多线程导致问题,那么加上一个同步锁吧!
修改后的代码如下,相对于 Version1.1,只是在方法签名上多加了一个 synchronized:
// Version 2
public class Single2 {
private static Single2 instance;
private Single2() {}
public static synchronized Single2 getInstance() {
if (instance == null) {
instance = new Single2();
}
return instance;
}
}
OK,加上 synchronized 关键字之后,getInstance 方法就会锁上了。如果有两个线程(T1、T2)同时执行到这个方法时,会有其中一个线程 T1 获得同步锁,得以继续执行,而另一个线程 T2 则需要等待,当第 T1 执行完毕 getInstance 之后(完成了 null 判断、对象创建、获得返回值之后),T2 线程才会执行执行。——所以这端代码也就避免了 Version1 中,可能出现因为多线程导致多个实例的情况。
但是,这种写法也有一个问题:给 getInstance 方法加锁,虽然会避免了可能会出现的多个实例问题,但是会强制除 T1 之外的所有线程等待,实际上会对程序的执行效率造成负面影响。
3.3 双重检查(Double-Check)版本
Version2 代码相对于 Version1 的代码的效率问题,其实是为了解决
1% 几率的问题,而使用了一个 100% 出现的防护盾。那有一个优化的思路,就是把 100% 出现的防护盾,也改为 1% 的几率出现,使之只出现在可能会导致多个实例出现的地方。
——有没有这样的方法呢?当然是有的,改进后的代码 Vsersion3 如下:
// Version 3
public class Single3 {
private static Single3 instance;
private Single3() {}
public static Single3 getInstance() {
if (instance == null) {
synchronized (Single3.class) {
if (instance == null) {
instance = new Single3();
}
}
}
return instance;
}
}
这个版本的代码看起来有点复杂,注意其中有两次 if (instance == null) 的判断,这个叫做『双重检查 Double-Check』。
第一个 if (instance == null),其实是为了解决 Version2 中的效率问题,只有 instance 为 null 的时候,才进入 synchronized 的代码段——大大减少了几率。
第二个 if (instance == null),则是跟 Version2 一样,是为了防止可能出现多个实例的情况。
—— 这段代码看起来已经完美无瑕了。
……
……
……
—— 当然,只是『看起来』,还是有小概率出现问题的。
这弄清楚为什么这里可能出现问题,首先,我们需要弄清楚几个概念:原子操作、指令重排。
知识点:什么是原子操作?
简单来说,原子操作(atomic)就是不可分割的操作,在计算机中,就是指不会因为线程调度被打断的操作。
比如,简单的赋值是一个原子操作:
m = 6; // 这是个原子操作
假如 m 原先的值为 0,那么对于这个操作,要么执行成功 m 变成了
6,要么是没执行 m 还是 0,而不会出现诸如 m=3 这种中间态——即使是在并发的线程中。
而,声明并赋值就不是一个原子操作:
int n = 6; // 这不是一个原子操作
对于这个语句,至少有两个操作:
① 声明一个变量 n
② 给n赋值为 6
——这样就会有一个中间状态:变量 n 已经被声明了但是还没有被赋值的状态。
——这样,在多线程中,由于线程执行顺序的不确定性,如果两个线程都使用 m,就可能会导致不稳定的结果出现。
知识点:什么是指令重排?
简单来说,就是计算机为了提高执行效率,会做的一些优化,在不影响最终结果的情况下,可能会对一些语句的执行顺序进行调整。
比如,这一段代码:
int a ; // 语句1
a = 8 ; // 语句2
int b = 9 ; // 语句3
int c = a + b ; // 语句4
正常来说,对于顺序结构,执行的顺序是自上到下,也即 1234。但是,由于指令重排的原因,因为不影响最终的结果,所以,实际执行的顺序可能会变成 3124 或者 1324。由于语句 3 和 4 没有原子性的问题,语句 3 和语句 4 也可能会拆分成原子操作,再重排。——也就是说,对于非原子性的操作,在不影响最终结果的情况下,其拆分成的原子操作可能会被重新排列执行顺序。
OK,了解了原子操作和指令重排的概念之后,我们再继续看 Version3 代码的问题。下面这段话直接从陈皓的文章 (深入浅出单实例SINGLETON设计模式) 中复制而来:
主要在于 singleton = new Singleton() 这句,这并非是一个原子操作,事实上在 JVM 中这句话大概做了下面 3 件事情。
1.给 Singleton 分配内存
2.调用 Singleton 的构造函数来初始化成员变量,形成实例
3.将 Singleton 对象指向分配的内存空间(执行完这步 Singleton 才是非 null 了)但是在 JVM 的即时编译器中存在指令重排序的优化。也就是说上面的第二步和第三步的顺序是不能保证的,最终的执行顺序可能是 1-2-3 也可能是 1-3-2。如果是后者,则在 3 执行完毕、2 未执行之前,被线程二抢占了,这时 instance 已经是非 null 了(但却没有初始化),所以线程二会直接返回 instance,然后使用,然后顺理成章地报错。
再稍微解释一下,就是说,由于有一个『instance 已经不为 null 但是仍没有完成初始化』的中间状态,而这个时候,如果有其他线程刚好运行到第一层 if (instance == null) 这里,这里读取到的 instance 已经不为 null 了,所以就直接把这个中间状态的 instance 拿去用了,就会产生问题。
这里的关键在于——线程 T1 对 instance 的写操作没有完成,线程 T2
就执行了读操作。
3.4 终极版本:volatile
对于 Version3 中可能出现的问题(当然这种概率已经非常小了,但毕竟还是有的嘛~),解决方案是:只需要给 instance 的声明加上 volatile 关键字即可,Version4 版本:
// Version 4
public class Single4 {
private static volatile Single4 instance;
private Single4() {}
public static Single4 getInstance() {
if (instance == null) {
synchronized (Single4.class) {
if (instance == null) {
instance = new Single4();
}
}
}
return instance;
}
}
volatile 关键字的一个作用是禁止指令重排,把 instance 声明为 volatile 之后,对它的写操作就会有一个内存屏障(什么是内存屏障?),这样,在它的赋值完成之前,就不用会调用读操作。
注意:volatile 阻止的不 singleton = new Singleton() 这句话内部 [1-2-3] 的指令重排,而是保证了在一个写操作([1-2-3])完成之前,不会调用读操作(if (instance == null))。
——也就彻底防止了Version3中的问题发生。
——好了,现在彻底没什么问题了吧?
……
……
……
好了,别紧张,的确没问题了。
大名鼎鼎的 EventBus 中,其入口方法 EventBus.getDefault() 就是用这种方法来实现的。
……
……
……
不过,非要挑点刺的话还是能挑出来的,就是这个写法有些复杂了,不够优雅、简洁。(傲娇脸)(  ̄ー ̄)
4. 饿汉式单例
下面再聊了解一下饿汉式的单例。
如上所说,饿汉式单例是指:指全局的单例实例在类装载时构建的实现方式。
由于类装载的过程是由类加载器(ClassLoader)来执行的,这个过程也是由 JVM 来保证同步的,所以这种方式先天就有一个优势——能够免疫许多由多线程引起的问题。
4.1 饿汉式单例的实现方式
饿汉式单例的实现如下:
//饿汉式实现
public class SingleB {
private static final SingleB INSTANCE = new SingleB();
private SingleB() {}
public static SingleB getInstance() {
return INSTANCE;
}
}
对于一个饿汉式单例的写法来说,它基本上是完美的了。
所以它的缺点也就只是饿汉式单例本身的缺点所在了——由于 INSTANCE 的初始化是在类加载时进行的,而类的加载是由
ClassLoader 来做的,所以开发者本来对于它初始化的时机就很难去准确把握:
- 可能由于初始化的太早,造成资源的浪费
- 如果初始化本身依赖于一些其他数据,那么也就很难保证其他数据会在它初始化之前准备好。
当然,如果所需的单例占用的资源很少,并且也不依赖于其他数据,那么这种实现方式也是很好的。
知识点:什么时候是类装载时?
前面提到了单例在类装载时被实例化,那究竟什么时候才是『类装载时』呢?
不严格的说,大致有这么几个条件会触发一个类被加载:
- new 一个对象时
- 使用反射创建它的实例时
- 子类被加载时,如果父类还没被加载,就先加载父类
- jvm 启动时执行的主类会首先被加载
5. 一些其他的实现方式
5.1 Effective Java 1 —— 静态内部类
《Effective Java》一书的第一版中推荐了一个中写法:
// Effective Java 第一版推荐写法
public class Singleton {
private static class SingletonHolder {
private static final Singleton INSTANCE = new Singleton();
}
private Singleton (){}
public static final Singleton getInstance() {
return SingletonHolder.INSTANCE;
}
}
这种写法非常巧妙:
对于内部类 SingletonHolder,它是一个饿汉式的单例实现,在SingletonHolder 初始化的时候会由 ClassLoader 来保证同步,使 INSTANCE 是一个真·单例。
同时,由于 SingletonHolder 是一个内部类,只在外部类的 Singleton 的 getInstance() 中被使用,所以它被加载的时机也就是在
getInstance() 方法第一次被调用的时候。
——它利用了 ClassLoader 来保证了同步,同时又能让开发者控制类加载的时机。从内部看是一个饿汉式的单例,但是从外部看来,又的确是懒汉式的实现。
简直是神乎其技。
5.2 Effective Java 2 —— 枚举
你以为到这就算完了?不,并没有,因为厉害的大神又发现了其他的方法。
《Effective Java》的作者在这本书的第二版又推荐了另外一种方法,来直接看代码:
// Effective Java 第二版推荐写法
public enum SingleInstance {
INSTANCE;
public void fun1() {
// do something
}
}
// 使用
SingleInstance.INSTANCE.fun1();
看到了么?这是一个枚举类型……连 class 都不用了,极简。
由于创建枚举实例的过程是线程安全的,所以这种写法也没有同步的问题。
作者对这个方法的评价:
这种写法在功能上与共有域方法相近,但是它更简洁,无偿地提供了序列化机制,绝对防止对此实例化,即使是在面对复杂的序列化或者反射攻击的时候。虽然这中方法还没有广泛采用,但是单元素的枚举类型已经成为实现 Singleton 的最佳方法。
枚举单例这种方法问世一些,许多分析文章都称它是实现单例的最完美方法——写法超级简单,而且又能解决大部分的问题。
不过我个人认为这种方法虽然很优秀,但是它仍然不是完美的——比如,在需要继承的场景,它就不适用了。
6. 总结
OK,看到这里,你还会觉得单例模式是最简单的设计模式了么?再回头看一下你之前代码中的单例实现,觉得是无懈可击的么?
可能我们在实际的开发中,对单例的实现并没有那么严格的要求。
比如,我如果能保证所有的 getInstance 都是在一个线程的话,那其实第一种最简单的教科书方式就够用了。
再比如,有时候,我的单例变成了多例也可能对程序没什么太大影响……
但是,如果我们能了解更多其中的细节,那么如果哪天程序出了些问题,我们起码能多一个排查问题的点。早点解决问题,就能早点回家吃饭……:-D
—— 还有,完美的方案是不存在,任何方式都会有一个『度』的问题。比如,你的觉得代码已经无懈可击了,但是因为你用的是 JAVA 语言,可能 ClassLoader 有些 BUG 啊……你的代码谁运行在 JVM 上的,可能 JVM 本身有 BUG 啊……你的代码运行在手机上,可能手机系统有问题啊……你生活在这个宇宙里,可能宇宙本身有些 BUG 啊……o(╯□╰)o
所以,尽力做到能做到的最好就行了。
—— 感谢你花费了不少时间看到这里,但愿你没有觉得虚度。