笔记 · Cache line 缓存行对齐

最新推荐文章于 2023-04-23 13:36:08 发布

一介白衣只依你

最新推荐文章于 2023-04-23 13:36:08 发布

阅读量575

点赞数

分类专栏：多线程文章标签：缓存

本文链接：https://blog.csdn.net/qq_41975509/article/details/115483897

版权

多线程专栏收录该内容

17 篇文章 0 订阅

订阅专栏

假设计算单元要找变量X，需要从最近的缓存中找L1 --> L2 --> L3 --> 主内存。
如果是要读取一个变量则顺序为：主内存 -> L3 -> L2 -> L1，之后计算单元开始计算。

当我们读一个数据，会把相关的数据一块读过来(即按块读取)，
在这里插入图片描述

class B {
    private static class  T {
        public volatile long x = 0L;  // long 类型 8字节
    }
    public static T[] arr = new T[2];
    static {
        arr[0] = new T();
        arr[1] = new T();
    }
    /**
     * 在内存中有2块数据arr[0].x  记为x、arr[1].x 记为y，它们在同一个缓存行中。
     * 在CPU层面的数据一致性，是以cache line为单位(64字节)的。所以当同一个缓存
     * 行中的某个值发生了变化(volatile保证可见性)，需要通知另一个线程去拉取最新值。
     **/
    public static void main(String[] args) {
        Thread t1 = new Thread(() -> {
            for (long i = 0; i < 1000_0000L; i++){
	      // 线程t1 修改x的之后，每次都会通知线程t2拉取最新值
                arr[0].x = i;
            }
        });
        Thread t2 = new Thread(() -> {
            for (long i = 0; i < 1000_0000L; i++){
                arr[1].x = i;
            }
        });

        final  long start = System.nanoTime();
        t1.start();
        t2.start();

        try {
            t1.join();
            t2.join();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println((System.nanoTime() - start) / 100_0000);
    }
}

优化

class B1 {
    private static class  Padding {
        // long 类型 8字节  共占用56个字节
        public volatile long p1,p2,p3,p4,p5,p6,p7;
    }
    private static class T extends Padding {
// 56 + 8 = 64
        public volatile long x = 0L;
    }
    public static T[] arr = new T[2];
    static {
        arr[0] = new T();
        arr[1] = new T();
    }

    public static void main(String[] args) {
        Thread t1 = new Thread(() -> {
            for (long i = 0; i < 1000_0000L; i++){
 // 线程t1 的x变量，与线程t2 的x变量不在同一个 缓存行中，所以每次修改都不用通知
// t2，这样就提高了效率。
                arr[0].x = i;
            }
        });
        Thread t2 = new Thread(() -> {
            for (long i = 0; i < 1000_0000L; i++){
                arr[1].x = i;
            }
        });

        final long start = System.nanoTime();
        t1.start();
        t2.start();

        try {
            t1.join();
            t2.join();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println((System.nanoTime() - start) / 100_0000);
    }
}

一介白衣只依你

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
笔记 · Cache line 缓存行对齐

假设计算单元要找变量X，需要从最近的缓存中找L1 --> L2 --> L3 --> 主内存。如果是要读取一个变量则顺序为：主内存 -> L3 -> L2 -> L1，之后计算单元开始计算。当我们读一个数据，会把相关的数据一块读过来(即按块读取)，class B { private static class T { public volatile long x = 0L; // long 类型 8字节 } pu
复制链接

扫一扫