对于512点fft来说,62的fft程序用mpy指令来计算,需要6308个指令周期,64的程序用dotp指令来计算,需要3128个指令周期,这样,即便在62的程序基础上修改成可以饱和的fft程序,运算速度也要比64的程序慢,而在dotp指令上修改成可以饱和的算法比较困难,还不如直接调用16x32的64程序,只需要4k多个指令周期。
另外今天发现了库文件的读法,可以直接看到线性汇编和汇编源程序,太好了!
发现用线性汇编编译后的out文件为33k,而直接用汇编程序编译后的out文件为24k,还是小了很多。
另外今天发现了库文件的读法,可以直接看到线性汇编和汇编源程序,太好了!
发现用线性汇编编译后的out文件为33k,而直接用汇编程序编译后的out文件为24k,还是小了很多。