著名的Java并发编程大师都这么说了,你还不知道伪共享么!

285 篇文章 0 订阅
22 篇文章 0 订阅
本文介绍了DougLea对Java并发包的贡献,并探讨了CPU缓存架构、缓存行和伪共享问题。通过实例展示了伪共享如何影响多线程性能,并提出了使用@sun.misc.Contended注解或对象填充来优化。此外,还提到了利用JOL工具查看对象字节数和理解缓存行填充的重要性。
摘要由CSDN通过智能技术生成

一、Doug lea

在微博上看到这么一句话,挺有意思的。

Doug Lea是谁?为什么这么说?估计还真挺多人不认识他吧。

Doug Lea,中文名为道格·利。java.util.concurrent并发包的作者。说他是这个世界上对Java影响力最大的一个人,一点也不为过。因为两次Java历史上的大变革,他都间接或直接的扮演了举足轻重的角色。2004年所推出的Tiger。Tiger广纳了15项JSRs的语法及标准,其中一项便是JSR-166。JSR-166是来自于Doug编写的util.concurrent包,主要是关于J.U.C的技术规范。

上文摘抄自百度百科:

JSRs(Java Specification Requests),表示Java规范请求,由JCP成员向委员会提交的Java发展议案,经过一系列流程后,如果通过最终会体现在未来的Java中。

JCP全称Java Community Process ,翻译中文即是:Java社区进程。JCP成立于1998年,官网地址 https://www.jcp.org ,由社会各界Java组成的社区,主要规划和领导Java的发展。

二、CPU缓存架构

国内另一位大神,dubbo的创作者,曾经在他的ppt写过这样的一页

或许有人已经猜到这ppt作者是谁的,有兴趣可自行了解(需要完整ppt也可联系我!)。ppt描述的背后原理就是伪共享问题。

说起伪共享,还得从cpu的缓存架构说起。

CPU缓存可以分为一级缓存,二级缓存,三级缓存,每一级缓存中所储存的全部数据都是下一级缓存的一部分。当CPU要读取一个数据时,首先从一级缓存中查找,如果没有找到再从二级缓存中查找,如果还是没有就从三级缓存或内存中查找。一般来说,每级缓存的命中率大概都在80%左右,也就是说全部数据量的80%都可以在一级缓存中找到,只剩下20%的总数据量才需要从二级缓存、三级缓存或内存中读取。

越靠近 CPU 的缓存越快也越小。所以 L1 缓存很小但很快,紧接着L2 大一些,也会慢一些,L3更慢,最后到主存,主存保存着程序运行的所有数据,由所有 CPU 核共享。

三、CPU缓存行

CPU缓存由缓存行组成,缓存行长度为64字节,可以这么认为,缓存行是缓存更新的基本单位。缓存每次更新都从主内存中加载连续的 64 个字节。试想,如果在内存中有两个紧邻的long型变量a和b,当a加载到缓存时,b也可以一起被加载到缓存,下一次如果访问b则可以直接从缓存读取,这对读取的效率提升是非常大的。

但是,正因为缓存都以缓存行为基本单位处理,如果cpu core1修改a变量,core1上包含a变量的缓存行将失效,同时其他core上包含a变量的缓存行也将失效。此时,如果core2要访问和a在同一缓存行上的b变量,会被告知缓存行失效,这时只能到主内存重新加载b变量。

在《Java并发编程的艺术》一书中,第二章第11页如是说:

Doug lea在jdk7的并发包里面新增一个队列集合类LinkedTransferQueue,它在使用volatie变量时,用一种追加字节的方式来优化队列出队和入队的性能。

四、伪共享

缓存以缓存行为基本单位,当线程修改互相独立的变量时,如果这些变量在同一缓存行中,那么就会互相变量缓存值得有效性,从而影响访问性能,这就是伪共享。

看一个单元测试源码:

package com.tin.example.falls.sharing;
​
import org.springframework.util.StopWatch;
​
/**
 * title: AutoIncrement
 * <p>
 * description: 多线程环境下,long变量自增
 *
 * @author tin @看点代码再上班 on 2021/2/17 下午1:28
 */
public class AutoIncrement {
​
 public static void main(String[] args) throws InterruptedException {
 StopWatch stopWatch = new StopWatch("@看点代码再上班");
 stopWatch.start();
 System.out.println("====== start to iterate ======");
 autoIncrement(new LongNumber());
​
 stopWatch.stop();
 System.out.println("cost " + stopWatch.getTotalTimeMillis() + "ms");
 }
​
 private static void autoIncrement(LongNumber longNumber) throws InterruptedException {
 Thread t1 = new Thread(() -> {
 for (int i = 0; i < 100000000; i++) {
 longNumber.n1++;
 }
 });
​
 Thread t2 = new Thread(() -> {
 for (int i = 0; i < 100000000; i++) {
 longNumber.n2++;
 }
 });
​
 t1.start();
 t2.start();
 t1.join();
 t2.join();
 }
​
 static class LongNumber {
//        @sun.misc.Contended
 volatile long n1;
 volatile long n2;
 }
}

当我启用两个线程,分别自增1亿次n1和n2时,耗时大约3000+ms

当我在n1字段加上注解@sun.misc.Contended,重新跑程序,耗时变为800+ms

@sun.misc.Contended注解在Java 8后新增,其用来进行缓存行填充。它可以用于类级别的修饰,同时也可以用于字段级别的修饰,当应用于字段级别时,被注释的字段将和其他字段隔离开来,会被加载在独立的缓存行上。

@sun.misc.Contended注解和上文ppt中提及的追加字节效果是等同的(注解要生效需在启动参数上加-XX:-RestrictContended)。除了加注解,如果在n1和n2中间增加16个对象引用也同样起到作用(一个对象引用4个字节)。

我们要看一个对象所占的字节数大小怎么看?分享一个好东西,引用下面的包依赖:

<dependency>
 <groupId>org.openjdk.jol</groupId>
 <artifactId>jol-core</artifactId>
 <version>0.9</version>
 </dependency>

代码中显式打印对象即可:

ClassLayout.parseInstance(obj).toPrintable()

可以看到打印出来的结果:

五、结语

我是tin,一个在努力让自己变得更优秀的普通攻城狮。自己阅历有限、学识浅薄,如有发现文章不妥之处,非常欢迎加我提出,我一定细心推敲加以修改。

看到这里请安排个点赞再走吧,坚持原创不容易,你的正反馈是我坚持输出的最强大动力,谢谢啦!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值