cacheline基本理论

最新推荐文章于 2023-12-31 21:04:04 发布

weixin_30765505

最新推荐文章于 2023-12-31 21:04:04 发布

阅读量310

收藏

点赞数

原文链接：http://www.cnblogs.com/forTheDream1991/p/10732295.html

版权

一.cacheline

　　1.cache：解决cpu频率与内存访问之间速度差距越来越大的问题

　　

　　2.cacheline：cpu cache的最小单位，主流为64B

　　3.指导：访问数组数据在同一个cacheline内速度很快，若跨cacheline，则速度会慢很多，因为可能存在cache miss，需要将内存数据写入cache中

二.cacheline与内存之间的映射策略

　　1.hash策略：hash值的计算需要10K个cycle，无法满足cache访问几个或者几十个cycle的要求

2.Fully Associative：时间问题

　 3.Direct Mapped：对每块内存的访问是等概率的，否则cache使用率很低，并且冲突很多

　　4.N-Way Set Associative：高效

　　a.将N个cacheline分为一组

　　b.每个cacheline中，根据偏移进行寻址，所以64B，需要6bit进行表示

　　如下：4M cache，设N=16，则

　　①4M内存，16个64B的cacheline为一组，共有2^12组Set，用中间12bit表示
　　②最后6bit表示64B的cacheline内偏移

　　实际cache寻址过程如下：

　　①根据64bit表示的addr的12bit计算出set号，这样的话，只需要在本set内比较16个cacheline即可

　　②根据最后6bit表示的cacheline偏移，计算偏移地址

　　③对于set内的16个cacheline，结合前46bit，挨个比较每个cacheline中对应偏移的地址是否与addr相等

　　④若找到，则命中；否则cache miss

　　

三.cacheline替换策略LRU/Random

　　1.LRU：最近最少使用算法，核心思想是最近被使用的内存在将来也有很大可能被使用

四、cacheline与内存对齐之间的性能问题

参考：

http://cenalulu.github.io/linux/all-about-cpu-cache/

https://en.wikipedia.org/wiki/Cache_placement_policies

转载于:https://www.cnblogs.com/forTheDream1991/p/10732295.html

weixin_30765505

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值