neon常用指令（updating）

最新推荐文章于 2024-03-19 14:22:16 发布

Dwlufvex

最新推荐文章于 2024-03-19 14:22:16 发布

阅读量355

点赞数

分类专栏： C 嵌入式 neon 文章标签： arm_neon C

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43681115/article/details/132897435

版权

C 嵌入式 neon 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

函数参考手册：
https://developer.arm.com/architectures/instruction-sets/simd-isas/neon/intrinsics
并在左侧选择neon\

039%2Fimage.png&pos_id=img-zzYBGlM1-1694746128006)

Neon 128bit寄存器,所以可支持并行运算加快运算速度减少循环
CPU运算比加载数据快，速度瓶颈在加载数据这里。

指令集命名形式，后续有例子说明：
在这里插入图片描述

变量支持如下：此外int还分为int8,int16,int32.对应定点开发s8，s16, s32 Float uint 类似int
在这里插入图片描述

以下为目前开发中所涉及的常用指令
初始化指令
vld1q_s16 load 16x8
vld1_s16 load 16x4
示例：
在这里插入图片描述

vdup_n_s16(n) 初始化int16x4_t 变量,全为n
vdupq_n_s16(n) 初始化int16x8_t 变量,全为n

乘法指令：
16x8 vqdmulhq_s16 ( 16x8, 16x8) Lshl 1 and extractH and saturating
16x8 vqrdmulhq_s16 (16x8 , 16x8) Lshl 1 and extractH and saturating + rounding
V vector q saturating r rouding d Doubling mul mult h extrachH q 区分int16x8与int16x4
16x4 vqdmulh_s16 ( 16x4, 16x4) Lshl 1 and extractH

相反数：
int16x8 vnegq_s16(int16x8) negate int16x8
int16x8 vqnegq_s16(int16x8) negate + saturating
int16x4 vneg_s16(int16x4) negate int16x4

取低位指令
int16x4 vget_low_s16(int16x8_t) 取int16x8_t 前4个值出来

移位指令
int16x4 vqshl_n_s16(s16x4 , shift) 左移shift位并饱和处理
int16x8 vqshlq_n_s16(s16x8, shift) 左移shift位并饱和处理
int16x4 vshr_n_s16(s16x4,shift) 右移shift位
int16x8 vshrq_n_s16(s16x8,shift) 右移shif

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Dwlufvex CSDN认证博客专家 CSDN认证企业博客

码龄6年

26: 原创

38万+: 周排名

203万+: 总排名

7万+: 访问

: 等级

749: 积分

55: 粉丝

57: 获赞

66: 评论

315: 收藏

私信

关注

热门文章

分类专栏

linux 1篇
C 嵌入式 neon 1篇
python 15篇
泰拉瑞亚 1篇
wordprss 1篇
通信 1篇
matlab 2篇
笔记 1篇
视频隐写 1篇
windows一些问题 1篇
android studio 1篇
CTF 1篇

最新评论

安装kali与kali中文输入法(googlepinyin)的一些问题（个人安装时的问题记录）
Dwlufvex: 哈哈，几年前大学时写的分享，感谢指出！有时候我确实会写得有点神秘兮兮的，不过这也是探索未知领域的乐趣所在，不是吗？期待你的更多精彩评论，让我们一起探索更多有趣的话题！
安装kali与kali中文输入法(googlepinyin)的一些问题（个人安装时的问题记录）
芭比Q技术询问者: 什么东西，你在写给你自己看吗？你好懂哦
华为od机试81出租车计费python
weixin_46465321: 这个方法挺巧的，但复杂度高了，还是转换进制来得快，就当是拓展思维了附一个详细的Python代码 [code=python] def actual_cost(N): N = str(N) # 将输入转换为字符串，以便逐位处理 lens = len(N) # 获取数字的长度 num = 0 # 初始化实际费用 for i in range(lens): digit = int(N[i]) # 当前位的数字 if digit < 4: num += digit * (9 ** (lens - i - 1)) else: # 如果数字大于等于4，因为跳过了4，所以实际上的数字应该是当前数字减1 num += (digit - 1) * (9 ** (lens - i - 1)) return num # 示例 N = input() # 读取输入 print(actual_cost(N)) # 打印实际产生的费用 [/code]
华为od机试81出租车计费python
qq_41312260: 模仿表读数，遇到4就换成5此时计算替换前后的差值用表的读数减去差值就是实际值了
华为od 安全测试岗简谈机试面试【更新完】
KJ.JK: 2023华为OD机试真题(Python语言)：https://blog.csdn.net/m0_47384542/category_11954021.html?spm=1001.2014.3001.5482 2023华为OD机试真题(C语言) ：https://blog.csdn.net/m0_47384542/category_12265421.html 2023华为OD机试真题(C++语言)：https://blog.csdn.net/m0_47384542/category_12363874.html 2023华为OD机试真题(Java 语言)：https://blog.csdn.net/m0_47384542/category_12360182.html 2023华为OD机试真题(JS 语言)：https://blog.csdn.net/m0_47384542/category_12357945.html 2023华为OD机试真题(Golang语言) ：https://blog.csdn.net/m0_47384542/category_12445404.html 2023华为OD机试(C C++ Java Py JS)：https://blog.csdn.net/m0_47384542/category_12372873.html

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。