CPU 缓存

1 . CPU缓存描述

对于密集型应用提高cpu处理速度。核心提升缓存利用

2. 理解cpu架构

L3 +内存是共享,L2+L1(分开数据与指令)cpu独享

大约时钟周期
L14
L212
L330
内存100

我的电脑3.3ghz ,1个时钟周期大约0.33纳秒。如果cpu操作的数据或指令都在缓存中则直接读取,会带来倍极大的性能提升。所以对于cpu性能的提升核心 是提升cpu缓存的命中率。

3. Cache line

空间局部性原理:通常使用了a,隔壁的b,c,c都较大概率使用。所以cpu缓存一次载入abcd。。。等后续的元素。 通常Cacle line 64k 可配置coherency_line_size。加载a,后续的元素补足。这是为什么顺序读取会较快。同理,int 比float 少一倍字节,理论速度也是比float快很多。 Cache line 的特性有很多应用, 比如nginx  hash表存放域名。 桶大小就是cache line的大小。Disruptor 是为了最求cpu性能极致的一个并发框架,前后加7个long ,jdk 8 也有专门的注解@sun.misc.Contended+-XX:-RestrictContended,jdk9废弃

public class Data{
    public long p1,p2,p3,p4,p5,p6,p7;//防止与前一个对象产生伪共享
    public long X;
    public long p1,p2,p3,p4,p5,p6,p7;//防止不相关变量伪共享;
    public long Y;
    public long p1,p2,p3,p4,p5,p6,p7;//防止与下一个对象产生伪共享
}

4.提升指令缓存命中率

cpu含有分支预测器。借用别人例子:

int array[N];for (i = 0; i < TESTN; i++) array[i] = rand() % 256;


//写法1
for(i = 0; i < N; i++) { if (array [i] < 128) array[i] = 0;}
sort(array, array +N);

//写法2
sort(array, array +N);
for(i = 0; i < N; i++) { if (array [i] < 128) array[i] = 0;}

先排序会快很多。原因操作指令缓存,cpu含有分支预测提高速度。

5.多线程情况下的缓存应用

多线程情况下,线程调度会将缓存失效,解决办法线程或进程绑定cpu。减少cpu 核心迁移的次数。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值