NEON_7

最新推荐文章于 2020-11-25 12:09:11 发布

Adagrad

最新推荐文章于 2020-11-25 12:09:11 发布

阅读量229

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013049912/article/details/104836730

版权

为什么要依靠编译器进行自动矢量化？
编写经过手动优化的汇编内核或包含Neon内部函数的C代码，可以对软件中的Neon代码进行高度控制。但是，这些方法可能导致大量的可移植性和工程复杂性成本。

在许多情况下，高质量的编译器可以生成同样好的代码，但是所需的设计时间却少得多。允许编译器自动识别代码中使用Advanced SIMD指令的机会的过程称为自动向量化。

在特定的编译技术方面，自动向量化包括：

循环矢量化：展开循环以减少迭代次数，同时在每个迭代中执行更多操作。
超字级并行（SLP）矢量化：将标量运算捆绑在一起，以使用全宽Advanced SIMD指令。
自动向量化编译器包括Arm编译器6，Arm C / C ++编译器，LLVM-clang和GCC。

依靠编译器自动向量化的好处包括：

只要没有特定于体系结构的代码元素（如内联汇编或内部函数），就可以使用高级语言实现的程序是可移植的。
现代编译器能够自动执行高级优化。
以给定的微体系结构为目标就像设置单个编译器选项一样容易，而优化汇编程序则需要对目标硬件有深入的了解。

使用编译器生成Neon代码适合大多数项目。仅当生成的代码无法提供必要的性能时，或者高级语言不支持特定的硬件功能时，其他利用Neon的方法才有必要。例如，必须在汇编代码中配置系统寄存器以控制浮点功能。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Adagrad CSDN认证博客专家 CSDN认证企业博客

码龄11年

336: 原创

2万+: 周排名

3655: 总排名

68万+: 访问

: 等级

8495: 积分

486: 粉丝

564: 获赞

94: 评论

1710: 收藏

私信

关注

热门文章

分类专栏

ISP 6篇
paper 64篇
DeBayer 4篇
pytorch 29篇
NR 1篇
STL 10篇
SR 7篇
深度学习 7篇
qtside6 15篇
常用算法 10篇
数学 4篇
python 4篇
matplotlib 1篇
深入理解C++11新特性解析与应用 3篇
C++11 6篇
leetcode 35篇
Effective C++ 55篇

最新评论

基于傅里叶变换图像配准
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Low-Light Image Enhancement with Wavelet-based Diffusion Models
weixin_45811396: 这个论文发到了哪里呀
基于傅里叶变换图像配准
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
基于傅里叶变换图像配准
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
基于傅里叶变换图像配准
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。