QCOM Hexagon cDSP入门教程
文章平均质量分 96
从0到1搞懂高通cDSP开发!
发狂的小花
求职中,联系我。
AR行业经验、算法部署优化、图像处理算法、slam、SGBM、相机标定、TOF
CPU、DSP、GPU、算子针对硬件优化
展开
-
性能优化-高通的Hexagon DSP和NPU
手机必须处理电信和视听处理,同时最大限度地延长电池寿命。数字信号处理器 (DSP) 使用专用硬件从 CPU 卸载这些任务,从而降低功耗。高通公司的 Hexagon 在公司 Snapdragon 产品中卸载信号处理方面有着悠久的历史。为了应对近期机器学习应用的兴起,高通正在为 Hexagon 添加矩阵乘法功能。原创 2024-01-23 13:50:40 · 1595 阅读 · 4 评论 -
性能优化-HVX 指令介绍
本文主要介绍了 HVX 指令相关的知识,包括 HVX 寄存器相关内容,指令的背景依赖,部分常用 intrinsic HVX 指令。具体指令的详细内容及使用还需阅读 HVX 的指令文档,以及细致的实践操作。🌈我的分享也就到此结束啦🌈如果我的分享也能对你有帮助,那就太好了!若有不足,还请大家多多指正,我们一起学习交流!如果能评论下就太惊喜了!最后,☺祝愿大家每天有钱赚!!!欢迎关注、关注!原创 2024-01-22 14:50:31 · 1426 阅读 · 0 评论 -
性能优化-HVX 开发环境介绍
SDK 根目录hexagon_sdk 目录文件夹描述build编译所需的编译脚本文件docsHVX 开发相关说明文档examplesSDK 例子,HVX 样例位于 common 文件夹incsSDK 头文件目录,包含 HVX 函数及指令等头文件libsSDK 必需库文件目录,包含 HVX 开发运行所涉及的必备库及部分实现代码,例如 dspcv,fastcv,hexagon_nn 等scripts常用脚本目录环境变量设置脚本tools。原创 2024-01-22 14:43:12 · 976 阅读 · 0 评论 -
性能优化-HVX架构简介
跟 RPC 的调用类似,通常算法会编译成两个库,一个在 host 端运行的 Stub 库,一个在 device 端运行的 Skel 库。客户端需要把本地参数传给远程函数,本地调用的过程中,直接压栈即可,但是在远程调用过程中不在同一个内存里,无法直接传递函数的参数,因此需要客户端将要调用的函数名以及参数打包,然后通过网络发送到服务器。远程调用时,首先客户端需要告诉服务器,需要调用函数,这里函数和进程 ID 存在一个映射,客户端远程调用的时候,需要查一下函数,找到对应的 ID,然后执行函数的代码。原创 2024-01-20 22:41:44 · 1282 阅读 · 0 评论 -
性能优化-高通cDSP(QDSP6)架构详解
高通cDSP开发的商业价值30秒快速认识高通cDSP开发的商业价值【高通cDSP旨在处理一些简单但需要大量计算的场景,如图像处理、科学计算、AI训练、计算机视觉等。这些场景使用CPU来运算会极大的降低CPU的吞吐量,因此利用现代寄存器较宽的特性设计出了适配数据并行的DSP芯片,cDSP就是典型的代表。利用cDSP+CPU既可以满足一般的使用场景,也可以完成现代图像和视频数据的处理。原创 2023-11-09 10:44:30 · 1474 阅读 · 3 评论