Ceva xm4 DSP开发心得(转)

 

最近做了CevaDsp相关的开发,其实和Neon开发有点类似,主要是代码向量化运算。
Dsp芯片内含2个向量运算器,可以并行计算8个数值。

先说一下具体环境,使用的是,Windows10 + CevaToolbox v16
Ceva的这个编译器,license每年2500美刀,永久版是10000美刀,Ceva的仿真器,3000美刀。
还是挺贵的。

0、需要熟悉CevaDsp指令集,不然啥也干不了。

1、Ceva并行L/S指令,vpld,vpst,一次可以加载8个数据,
远比Neon,SSE强大,可以跨距超大加载,还支持自定义索引
8个数据的索引可以是(2,3,5,7,9,10,11,13)
但是bank不能冲突,64字节为冲突,索引也不能相同。

2、Ceva float强转int,short自带四舍五入,和C/C++原本语义不同。

3、Ceva float指令有 1 cycle 开根号,求导数的指令vfpinv,vfpsqrt,vfpsqrti
但是这些指令都是16位定点数,有一定的误差

4、片内内存速度是片外DDR的十几倍,没有cache,
全靠自己DMA操作进去,算完了DMA操作出来。

5、Ceva 有 1cycle 做卷积的指令,简直6上天。

6、条件判断影响并行,可以先做一个循环把有效数据提取出来,再做一个循环真正处理数据。

7、经常看不出来代码如何并行,要潜下心来多思考。



作者:我心若氺
链接:https://www.jianshu.com/p/591b06993be2
 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值