一起来学《深入理解计算机系统》第五章 combine函数总结

最新推荐文章于 2023-06-23 10:13:48 发布

a553455

最新推荐文章于 2023-06-23 10:13:48 发布

阅读量2.6k

点赞数

分类专栏： # C++与理论基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a553455/article/details/98109367

版权

C++与理论基础专栏收录该内容

19 篇文章 0 订阅

订阅专栏

conbine1
在这里插入图片描述
每次循环调用函数求向量长度，做多次无用功
conbine2

优化：只求一次向量长度
效率提升。
conbine3

减小函数调用，直接通过地址计算得到下一个累乘值
效率略微下降，因为现代处理器能够预测索引是在界内的，高度可预测（不怎么懂，书上P379)
-O1
在这里插入图片描述
-O2

O2比O1少了个每次重新从寄存器里面读dest值的过程。
conbine4

减小不必要的内存引用,因为dest的位置可能在向量中，所以conbine3不能自动优化成conbine4的样子。
conbine5

少了一半的循环开销

conbine6
在这里插入图片描述
对于整数类型，conbine5可通过编译器优化为conbine6的类型，因为对于整数类型，执行顺序无关，可并行执行
而对于浮点数，不能。

conbine7

在这里插入图片描述
conbin5的另外一种优化形式，将与acc结果无关的数据挑出来，可与acc乘法并行计算。但要自行承担可能浮点数乘法顺序不一样带来的后果。
最后终极优化
利用AVX向量指令，因为一个YMM寄存器32字节，可存放8个32位数据，或者4个64位数据，可用一条指令处理多个数据，除开长整数乘法代码，能够带来4倍或者8倍的速度提升。

在这里插入图片描述

有什么问题欢迎在评论区留言讨论！

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
一起来学《深入理解计算机系统》第五章 combine函数总结

conbine1每次循环调用函数求向量长度，做多次无用功conbine2优化：只求一次向量长度效率提升。conbine3减小函数调用，直接通过地址计算得到下一个累乘值效率下降-O1-O2O2比O1少了个每次重新从寄存器里面读dest值的过程。conbine4减小不必要的内存引用,因为dest的位置可能在向量中，所以conbine3不能自动优化成conbine4的...
复制链接

扫一扫

专栏目录

a553455 CSDN认证博客专家 CSDN认证企业博客

码龄6年

65: 原创

6万+: 周排名

85万+: 总排名

12万+: 访问

: 等级

1668: 积分

12: 粉丝

70: 获赞

33: 评论

173: 收藏

私信

关注

热门文章

分类专栏

备忘 2篇
算法 1篇
程序员生活 2篇
过时 1篇
设计模式 4篇
摄影知识 1篇
未完成
Machine Learning 3篇
错误 7篇
奇怪的错误 7篇
学习 1篇
OpenGL 7篇
C++与理论基础 19篇
QT 5篇

最新评论

一起来学深入理解计算机系统习题5.8 CPE的下界
apple_50569014: 在n极大的情况下在实践中非关键路径上的操作当成是黑盒子忽略它(不在本书讨论范围),只关注关键路径,关键路径的操作按书上的来算因为我们算的本来就是一个大约的值`不存在准确这是一套在实践中有效的方法,我们按他的思路来理解,而不是深究浅色 * 如果在一个周期内完成的,在n极其大的时候,机器它可能存在很多种优化的可能.作为程序员不需要关心这些可能楼下的例子大概率是错的
一起来学深入理解计算机系统习题5.8 CPE的下界
Gwaeron: 但是这是不是意味着一个时钟周期可以做三个浮点乘法，但书上说Haswell处理器浮点乘的容量是2
OpenWrt + 每步科技DDNS 实现ipv6动态域名解析方法
a553455: ssh网上教程很多的，百度搜索"ssh linux"就能找到。
OpenWrt + 每步科技DDNS 实现ipv6动态域名解析方法
qq_32809081: 大神能够写详细点吗？小白SSH不会用，谢谢大神
一起来学深入理解计算机系统习题5.8 CPE的下界
csu-yuuki: 有道理老哥，但是不是只有两个浮点乘法器吗，怎么在同一个时钟周期做三个浮点乘法运算

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。