体系结构
文章平均质量分 94
关于计算机体系结构的学习总结
Litomas
这个作者很懒,什么都没留下…
展开
-
多处理机的Cache一致性问题及其解决方案
多处理机的Cache一致性问题及其解决方案多处理机的Cache一致性问题及其解决方案1 多处理机体系结构2 Cache一致性问题3 监听一致性协议3.1 写作废方式3.1.1 具体流程3.1.2 状态转换图3.2 写更新方式4 目录一致性协议多处理机的Cache一致性问题及其解决方案1 多处理机体系结构一种很朴素的提高计算机解决问题的性能的方法是,把多个小的计算机连接起来、并行执行相对独立的任务、必要时互相做到通信,就可以制造出一台功能强大、性能较高的计算机,这也是多处理机技术的基本思想。在这,我们原创 2021-01-26 18:53:52 · 9192 阅读 · 2 评论 -
如何提升 Cache 的性能
如何提升 Cache 的性能如何提升 Cache 的性能1 Cache 的基本结构与原理2 评估 Cache 的性能3 通过降低失效率来提升 Cache 性能3.1 Cache 失效的原因有如下三种:3.2 通过适当调整块大小来降低失效率3.3 通过编译器优化来降低失效率4 通过减少失效开销来提高 Cache 性能4.1 运用写缓冲及写合并技术4.2 非阻塞Cache 技术4.3 其它5 通过降低命中时间来提升 Cache 性能5.1 使用容量小、结构简单的 Cache5.2 利用Trace Cache技术原创 2021-01-25 16:51:33 · 1981 阅读 · 0 评论 -
几种通过降低Cache失效率来提升程序性能的方法
几种通过降低Cache失效率来提升程序性能的方法1 将矩阵转置2 分块处理矩阵乘法3 将分块和转置结合4 总结 当程序访问多个数组时,经常会出现有些数组按行访问,有些数组按列访问的情况。以矩阵的乘法为例, C=A×BC=A\times BC=A×B ,经典的计算矩阵乘法的算法如下:void mult() { for(int i=0;i<N;i++) { for(int j=0;j<N;j++) { double res=0.0;原创 2020-12-11 21:50:09 · 1801 阅读 · 0 评论 -
Trace Cache
Trace Cache1 前言 当今应用程序对处理器性能的需求不断增加,而改进指令提取的机制,使得处理器能以更短的时间读取更多的指令,能有效提高处理器的性能。Trace Cache正是一种可以加快指令提取的技术。相比于指令Cache存储静态代码块,Trace Cache存储的基本单元是动态的指令流,可以有效减少取错指令的情况。例如,在静态代码块中,由于分支跳转指令的存在,在分支跳转指令后的指令程序可能不会执行,此时如果将这部分代码存入指令Cache中,不仅会造成存储空间的浪费,也会影响处理器提取指令的原创 2020-12-10 16:27:39 · 1554 阅读 · 0 评论