矩阵、浮点运算测试报告

最新推荐文章于 2023-06-20 13:41:56 发布

dfman

最新推荐文章于 2023-06-20 13:41:56 发布

阅读量2.3k

点赞数

分类专栏：测试文章标签：测试 float 汇编算法优化语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dfman/article/details/175509

版权

测试专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1）使用D3DXMatrixMultiply进行矩阵相乘
2）使用优化的4元数算法模拟矩阵相乘（相乘的结果与1相同）
3）最笨的办法计算矩阵相乘（要算64个乘法、48个加法、以及若干赋值）
4）使用SSE汇编计算矩阵相乘（要算64个乘法、48个加法、以及若干赋值）
5）使用xmmintrin指令集计算矩阵相乘

结果表明：
1）最快，估计不仅指令进行了优化，算法也进行了优化
2）是1的4～5倍，与3相比，证明算法起了作用
3）是1的10倍左右
4）与3差不多，我ft，这是为什么？我明明用的是汇编啊？怎么速度一点也没快！！！
5）与4差不多。

经验教训：
1）不能直接声明float[4] f这样的浮点数组，由于对其问题，在汇编语言中运行不了，应该这样声明__declspec(align(16)) float[4] f; 或者这样声明
union sse4 {
    __m128 m;
    float f[4];
};
2）那么矩阵就是这样声明的了：
union sse16 {
    __m128 m[4];
    float f[4][4];
};

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
矩阵、浮点运算测试报告

1）使用D3DXMatrixMultiply进行矩阵相乘2）使用优化的4元数算法模拟矩阵相乘（相乘的结果与1相同）3）最笨的办法计算矩阵相乘（要算64个乘法、48个加法、以及若干赋值）4）使用SSE汇编计算矩阵相乘（要算64个乘法、48个加法、以及若干赋值）5）使用xmmintrin指令集计算矩阵相乘结果表明：1）最快，估计不仅指令进行了优化，算法也进行了优化2）是1的4～5倍，与3相比，证明
复制链接

扫一扫

专栏目录

dfman CSDN认证博客专家 CSDN认证企业博客

码龄22年

18: 原创

124万+: 周排名

186万+: 总排名

4万+: 访问

: 等级

687: 积分

1: 粉丝

0: 获赞

19: 评论

4: 收藏

私信

关注

热门文章

分类专栏

最新评论

BSP树(1)
@十三阿哥: 国内就这样，文章大都是一个抄一个，滥竽充数，给我抽那鳖孙。
BSP树(1)
@十三阿哥: 至少可以滥竽充数。不是吗。
windows平台下编译stunnel
lyl85: 感觉不大可信，我看源码里很多都是Linux库、函数，有那么容易吗？
a*算法初步（源代码）
baoyixu: 最后生成的路径没有遍历孩子节点有和用途呀
a*算法初步（源代码）
baoyixu: 已经处理过了呀

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。