Digital signal processing数字信号处理:FFT IIR FIR采样傅里叶变换类的基础知识
Digital signal processor 数字信号处理
.
二.ceva 的DSP
Ceva Dsp公司及产品介绍_有石为玉的博客-CSDN博客_ceva dsp1、Ceva公司ceva:美国思华科技,2002年成立,一家仅仅300多人的以色列公司,却做出这么多伟大的产品,2017有12亿台的设备搭载了ceva的dsp。大部分中国厂商就是买IP,然后生产芯片,打价格战。ARM:专门提供微处理器IP核授权。Ceva:提供DSP IP授权。这两家都是自己不生产芯片,只提供授权,现在ceva应该已经是dsp领域的arm了。官网:https://www...https://blog.csdn.net/weixin_41770169/article/details/80829172?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522165569146316781667876960%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=165569146316781667876960&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-1-80829172-null-null.142^v17^control,157^v15^new_3&utm_term=ceva+dsp&spm=1018.2226.3001.4187
三.CEVA 开发心得
最近做了CevaDsp相关的开发,其实和Neon开发有点类似,主要是代码向量化运算。
Dsp芯片内含2个向量运算器,可以并行计算8个数值。
先说一下具体环境,使用的是,Windows10 + CevaToolbox v16
Ceva的这个编译器,license每年2500美刀,永久版是10000美刀,Ceva的仿真器,3000美刀。
还是挺贵的。
0、需要熟悉CevaDsp指令集,不然啥也干不了。
1、Ceva并行L/S指令,vpld,vpst,一次可以加载8个数据,
远比Neon,SSE强大,可以跨距超大加载,还支持自定义索引
8个数据的索引可以是(2,3,5,7,9,10,11,13)
但是bank不能冲突,64字节为冲突,索引也不能相同。
2、Ceva float强转int,short自带四舍五入,和C/C++原本语义不同。
3、Ceva float指令有 1 cycle 开根号,求导数的指令vfpinv,vfpsqrt,vfpsqrti
但是这些指令都是16位定点数,有一定的误差
4、片内内存速度是片外DDR的十几倍,没有cache,
全靠自己DMA操作进去,算完了DMA操作出来。
5、Ceva 有 1cycle 做卷积的指令,简直6上天。
6、条件判断影响并行,可以先做一个循环把有效数据提取出来,再做一个循环真正处理数据。
7、经常看不出来代码如何并行,要潜下心来多思考。