Java并发学习(持续更新中)

1. 多线程下的一些问题

1.1 多线程就一定快吗?

答案是不一定。

首先我我们知道,多线程当线程数使用不当会存在比较大的风险,比如,甚至性能不如单线程,这其中一个重要的原因就是:上下文切换。

上下文切换的代价是高昂的,因为在核心上交换线程会花费很多时间。上下文切换的延迟取决于不同的因素,大概在在 50 到 100 纳秒之间。考虑到硬件平均在每个核心上每纳秒执行 12 条指令,那么一次上下文切换可能会花费 600 到 1200 条指令的延迟时间。实际上,上下文切换占用了大量程序执行指令的时间。

如果存在跨核上下文切换(Cross-Core Context Switch),可能会导致 CPU 缓存失效(CPU 从缓存访问数据的成本大约 3 到 40 个时钟周期,从主存访问数据的成本大约 100 到 300 个时钟周期),这种场景的切换成本会更加昂贵。

1.1 如何减少上下文切换?
  • 无锁编程
  • CAS
  • 使用最小线程
  • 使用协程
1.1.1 无锁

顾名思义,直接放弃使用锁,如将数据的ID按照Hash算法取模分段,不同的线程处理不同段的数据。

1.1.2 CAS

CAS即CompareAndSwap,即比较并交换,是一种乐观锁,并不会引起进程的阻塞,使用CAS来更新数据则不需要加锁

1.1.3 减少线程数

我们知道Java有个ThreadPoolExcoutor,而阿里巴巴编码插件也在建议我们使用这个线程池方式去创建多线程进行操作。而假设我们设置了maximumPoolSize为一个很大的数,而我的电脑核心线程数假设只有8,那么我这剩下的就会一直在等待对列里去进行竞争从而获取到CPU。

1.1.4 使用协程

什么是协程?

协程(Coroutines)是一种比线程更加轻量级的存在,正如一个进程可以拥有多个线程一样,一个线程可以拥有多个协程。

协程不是被操作系统内核所管理的,而是完全由程序所控制,也就是在用户态执行。这样带来的好处是性能大幅度的提升,因为不会像线程切换那样消耗资源。

协程不是进程也不是线程,而是一个特殊的函数,这个函数可以在某个地方挂起,并且可以重新在挂起处外继续运行。所以说,协程与进程、线程相比并不是一个维度的概念。

1.2 死锁

多线程下。极易造成死锁的发生。

死锁是指两个或两个以上的线程在执行过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程。

产生条件:

1)互斥条件:指进程对所分配到的资源进行排它性使用,即在一段时间内某资源只由一个进程占用。如果此时还有其它进程请求资源,则请求者只能等待,直至占有资源的进程用毕释放。

2)请求和保持条件:指进程已经保持至少一个资源,但又提出了新的资源请求,而该资源已被其它进程占有,此时请求进程阻塞,但又对自己已获得的其它资源保持不放。

3)不剥夺条件:指进程已获得的资源,在未使用完之前,不能被剥夺,只能在使用完时由自己释放。

4)环路等待条件:指在发生死锁时,必然存在一个进程——资源的环形链,即进程集合{P0,P1,P2,···,Pn}中的P0正在等待一个P1占用的资源;P1正在等待P2占用的资源,……,Pn正在等待已被P0占用的资源。

避免死锁的几个常见方法

  • 避免一个线程同时获取多个锁。
  • 避免一个线程在锁内同时占用多个资源,尽量保证每个锁只占用一个资源。
  • 尝试使用定时锁,使用lock.tryLock(timeout)来替代使用内部锁机制。
  • 对于数据库锁,加锁和解锁必须在一个数据库连接里,否则会出现解锁失败的情

2. 深入理解volatile关键字

2.1 什么是volatile?

Java语言规范第3版中对volatile的定义如下:Java编程语言允许线程访问共享变量,为了 确保共享变量能被准确和一致地更新,线程应该确保通过排他锁单独获得这个变量。Java语言 提供了volatile,在某些情况下比锁要更加方便。如果一个字段被声明成volatile,Java线程内存
模型确保所有线程看到这个变量的值是一致的。

举个简单的例子:

instance = new Singleton();                 // instance是volatile变量

那么这个操作再字节码的层面上发生了什么?

0x01a3de1d: movb $0×0,0×1104800(%esi);
0x01a3de24: lock addl $0×0,(%esp);

有volatile变量修饰的共享变量进行写操作的时候会多出第二行汇编代码,通过查IA-32架 构软件开发者手册可知,Lock前缀的指令在多核处理器下会引发了两件事情[1]。

  1. 将当前处理器缓存行的数据写回到系统内存。
  2. 这个写回内存的操作会使在其他CPU里缓存了该内存地址的数据无效。

volatile的两条实现原则

  1. Lock前缀指令会引起处理器缓存回写到内存。
  2. 一个处理器的缓存回写到内存会导致其他处理器的缓存无效

涉及到了一个知识点:缓存一致性协议。

2.1.1 MESI缓存一致性协议
M: 被修改(Modified)该缓存行只被缓存在该CPU的缓存中,并且是被修改过的(dirty),即与主存中的数据不一致,该缓存行中的内存需要在未来的某个时间点(允许其它CPU读取请主存中相应内存之前)写回(write back)主存。当被写回主存之后,该缓存行的状态会变成独享(exclusive)状态。
E: 独享的(Exclusive)该缓存行只被缓存在该CPU的缓存中,它是未被修改过的(clean),与主存中数据一致。该状态可以在任何时刻当有其它CPU读取该内存时变成共享状态(shared)。同样地,当CPU修改该缓存行中内容时,该状态可以变成Modified状态。
S: 共享的(Shared)该状态意味着该缓存行可能被多个CPU缓存,并且各个缓存中的数据与主存数据一致(clean),当有一个CPU修改该缓存行中,其它CPU中该缓存行可以被作废(变成无效状态(Invalid))。
I: 无效的(Invalid)该缓存是无效的(可能有其它CPU修改了该缓存行)。

在这里插入图片描述

  1. 假设CPU1率先抢到时间片,当变量count加载至CPU缓存中时,会将count的使用标志为(E独占:首次加载会将变量置为独占,也就说明没有其他CPU进行加载)
  2. CPU2也获得时间片,把变量count加载缓存中,此时count的使用标志为(E独占),并发送消息至总线,告知其他CPU读取了变量的值,各CPU通过时刻监听(总线嗅探机制)获得到此变量已被多个CPU所加载,那么此时CPU2就会将自身count的使用标志置为(S共享),CPU1也会将变量的使用标志也会置为(S)
  3. CPU1从缓存中加载count至寄存器中进行自增操作,执行完毕之后,count = 0 -> 1,此时由于count的值发生了变化,因此CPU1中变量count使用标志应为(M修改),此时CPU1会发送消息至总线,告知其他线程已经修改了变量count 的值,其他CPU嗅探到值的修改,就会将自身变量count的使用标志置为(I无效)
  4. CPU1会将M状态的变量立刻写回至主内存中,写回完毕之后,CPU1会将使用状态置为(E独享),发送消息至总线,告知其他CPU已经写回完毕,其他CPU会再此从主内存中读取变量count的值,读取完毕之后,也会发送消息至总线,其他CPU嗅探到之后将自身变量count置为(S共享),自身变量的使用状态也会置为(S共享)

IA-32处理器和Intel 64处 理器使用MESI(修改、独占、共享、无效)控制协议去维护内部缓存和其他处理器缓存的一致 性。在多核处理器系统中进行操作的时候,IA-32和Intel 64处理器能嗅探其他处理器访问系统内存和它们的内部缓存。处理器使用嗅探技术保证它的内部缓存、系统内存和其他处理器的 缓存的数据在总线上保持一致。例如,在Pentium和P6 family处理器中,如果通过嗅探一个处理器来检测其他处理器打算写内存地址,而这个地址当前处于共享状态,那么正在嗅探的处理器将使它的缓存行无效,在下次访问相同内存地址时,强制执行缓存行填充。

3. 原子操作

原子(atomic)本意是“不能被进一步分割的最小粒子”,而原子操作(atomic operation)意 为“不可被中断的一个或一系列操作”。

3.1 CPU如何保证原子性?

32位IA-32处理器使用基于对缓存加锁总线加锁的方式来实现多处理器之间的原子操作。首先处理器会自动保证基本的内存操作的原子性。处理器保证从系统内存中读取或者写入一个字节是原子的,意思是当一个处理器读取一个字节时,其他处理器不能访问这个字节 的内存地址。Pentium6和最新的处理器能自动保证单处理器对同一个缓存行里进行16/32/64位的操作是原子的,但是复杂的内存操作处理器是不能自动保证其原子性的,比如跨总线宽度、跨多个缓存行和跨页表的访问。但是,处理器提供总线锁定和缓存锁定两个机制来保证复杂内存操作的原子性。

3.1.1 通过总线锁保证原子性

简单来说,总线锁就是使用处理器提供的一个 LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占共享内存。

3.1.2 通过缓存锁定来保证原子性

总线锁定把CPU和内存之间的通信锁住了,这使得锁定期间,其他处理器不能操作其他内存地址的数据,所以总线锁定的开销比较大,目前处理器在某些场合下使用缓存锁定代替总线锁定来进行优化。

简单来讲,缓存锁定会讲数据缓存在处理器的L1、L2、L3高速缓存里,原子操作就可以直接在处理器内部进行,而不需要锁住总线,导致其他CPU不能和内存进行通信,将缓存内的数据通过缓存一致性协议来保证操作的原子性。而缓存一致性协议就是上面提到的MESI

3.2 Java如何实现原子操作
  • 加锁(lock、synchronized)
  • CAS操作
3.2.1 CAS操作

JVM中的CAS操作正是利用了处理器提供的CMPXCHG指令实现的。自旋CAS实现的基本 思路就是循环进行CAS操作直到成功为止。即:指令是原子的,并且CAS操作只有一个机器指令,那么就可以认为,CAS操作是原子的!

3.2.2 使用锁机制实现原子操作

锁机制保证了只有获得锁的线程才能够操作锁定的内存区域。JVM内部实现了很多种锁 机制,有偏向锁、轻量级锁和互斥锁。除了偏向锁,JVM实现锁的方式都用了循环 CAS,即当一个线程想进入同步块的时候使用循环CAS的方式来获取锁,当它退出同步块的时候使用循环CAS释放锁

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值