大厂之路一由浅入深、并行基础、源码分析一 线程的基础概念

对于java后端研发工程师的学习,高并发是重点也是难点,本想在书上做标记即可,但发现看过一遍后并没有在脑中有系统的框架,因此通过写博客,以及吸收别人的博客精华做总结

  • 应用场景:其实主要用于两大块,“图像处理”和“服务端程序

  • 为什么要研究并发:主要是因为就目前的科研水平而言,无法在物质分子以下层面进行工作(量子计算机的由来,因本身研究方向是量子密钥,所以也有所了解),所以4GB的芯片已经接近极限了(集成电路的 晶体管 已经不能翻倍,也可以芯片的性能不能再提高,Intel公司在2004年先后推迟了4GB芯片的发布时间最终取消了4GB计划,这也就是 "摩尔定理的失效 ")。2005年开始,我们就不再追求单核的计算速度,而是研究 如何将多个独立的计算单元整合到单独的CPU上,也就是”多核CPU,甚至专业服务器配有好几个独立的CPU,并且每一个CPU都包含多核,这时候”摩尔定理生效(每18~24月,CPU的核心数翻一翻)“了。因此,我们可以这样说:“并发或多或少是由于硬件设计者已经无计可施导致的,他们将摩尔定律的失效的责任推给了软件的开发者"简化的硬件设计方案必然会带来软件设计的复杂性”。

  • 关于并行的两个定律:Amdahl定律和Gustafson定律,两个定律虽然得出的结果是矛盾的,但是它们是通过不同的角度来分析的,但是统一的当并行化代码比例到100%,则加速比为n(处理器个数

当我们知道为什么要研究并发的时候,我们就要知道几个相关概念:

  • 同步:同步方法调用一旦开始,调用者必须等到方法调用返回,才能继续后续的工作。

  • 异步:异步方法就需要等到方法调用返回,就可以进行后续的工作。

  • 并行:就是”同时进行“,比如多核CPU(坐缆车上去看风景)。

  • 并发:并发是视觉上的并行,并不是真正意义上的”同时进行“,而是多个任务交替执行,只不过交替频率高,给我们的感觉是”同时进行“(比如下雨天爬山,我们要一边看路,一一边看风景)。

  • 临界区:临界区表示一种公共资源或共享资源,可以多个线城使用,但是每一次,只能一个线程使用它,一旦临界区资源被占用,其他线程想要使用这个资源就必须得等待(比如一个办公室的打印机)。

  • 阻塞:阻塞是多线程之间的相互影响,当一个线程占用了临界区资源,其他所有需要这个资源的线程就必须在这个临界区中等待。等待会导致线程挂起,这就是阻塞

  • 非阻塞:和阻塞不同的是,线程不会挂起,而是不断尝试向前执行 (自旋)。

  • 多线程活跃性问题

  • 死锁(最糟糕的情况):A等B,B等A,都等待对方释放公共资源

  • 饥饿:一个或多个线程因为种种原因无法获得所需要的资源,导致一直无法执行。比如:Ⅰ、它的线程优先级太低,而高优先级的线程不断抢断资源,导致低线程无法工作。Ⅱ、某一个线程一直占用资源不放,导致它需要的这个资源的线程无法正常执行。

  • 活锁:线程之间相互“谦让”,主动释放资源等。

  • 并发级别
    由于临界区的存在,多线程之间的并发必须控制,根据并发的策略,我们可以把并发的级别分成5个级别,阻塞无饥饿无障碍无锁无等待

  1. 阻塞(悲观策略):一个线程占用共享资源,其他线程就需要挂起等待,无法继续执行,比如我们用到的 “synchronized”关键字或者 重入锁
  2. 无饥饿(阻塞调度)(悲观策略):如果线程之间有优先级,那么线程调度的时候总是要倾向于先满足高优先级的线程,这就可能导致低优先级的线程产生饥饿(这时候我们可以通过 锁是公的,按照 先来后到(FIF0 的规则进行线程调度)
  3. 无障碍“(非阻塞调度)(乐观策略):两个线程可以无障碍执行,不会因为临界区的问题导致一方被挂起,但是如果多个线程进行回滚,而都走不出临界区。换一种说法:不同的线程都可以进入临界区,读线程可以,但是写线程的话需要判断当前数据有没有发生竞争,也就是有没有中途被别人修改,如果修改了则回滚,如何实现?我们可以通过设置一个"一致性标记"来实现,再修改前先保存这个标记,然后再修改数据,然后看这个标记是否被人改过。
  4. 无锁:本质上是无障碍的改进,解决了“无障碍”并发级别的缺点,也就是 “无障碍”+“一致性标记”,能保证总有一个线程可以走出临界区,一般我们通过do-while来循环判断,判断用的 compareAndSet,这里我们额外探讨,本质是 CAS + 标志位 语句。
  5. 无等待:本质上是无锁的改进,因为无锁只是要求一个线程可以在有限步内完成操作,而无等待要求所有的线程都必须在有限步内完成。无等待可以根据do-while循环次数来进一步分成 有界无等待线程数无关的无等待。应用:RCU结构(Read Copy Update),所有的读线程都是无等待的,它们既不会被锁定等待也不会引起任何冲突。写线程可以先修改原始数据的副本,接着只修改副本数据,修改完后在合适的时机回写数据 (读写分离)
  • 内存模型(JMM)中,多线程的AVO原子性、可见性、有序性
    1、原子性:一个操作是不可中断的,常见的一些 原子性操作
    1)除long和double之外的基本类型的赋值操作(32位
    2)所有引用reference的赋值操作
    3)java.concurrent.Atomic.* 包中所有类的一切操作
    2、可见性:当一个线程修改了共享变量的值时,其他线程能够立即知道这个修改。可见性是一个综合性问题:比如缓存优化,硬件优化(比如内存的读写操作不会立即执行,而是会先进入一个硬件队列等待(可以通过设置volatile来修改直接写进内存,而不是写入缓存)),还有一些别的原因,比如指令重排以及编译器优化。
    3、有序性:有序性问题的原因是程序在执行时,可能会进行指令重排,重排后的指令与原指令的顺序未必一致(指令重排的前提是保证串行语义的一致性,但不能保证多线程的语义也一致)( 指令重排有优劣,比如优点可以减少中断,但是缺点是可能会影响“可见性”):哪些指令不能重排:
    1)volatile规则:volatile变量的写先于读发生,这保证了volatile变量的可见性。
    2)锁规则:解锁(unlock)必然发生在随后的加锁(lock)前。
    3)传递性:A先与B,B先与C,那么A必然先于C。
    4)线程的start()方法先于它的每一个动作。
    5)线程的所有操作先于线程的终结(Thread.join())。
    6)线程的中断(interrupt())先于被中断线程的代码。
    7)对象的构造函数的执行,结束先于finalize()方法。
  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值