1024点Fourier变换:
DFT直接运算:
1M点的复数乘法
4M点的实数乘法;考虑加法和其它的,大约10MOPs=0.01TOP,所以1s钟可以做100次1024点DFT。100FPS的帧率
FFT:10K点的复数乘法
40K点的实数乘法,同样考虑加法和其它的,大约100KOPs,所以1s钟可以做10000次1024点FFT。
考虑数据搬移调度,还会再少一些。
考虑一个CNN
1024x768的图像,3x3的卷积核,101层
大约1000x9x100=1M的乘法,与1024点DFT类似。
考虑加法、池化,logistic等函数,预计<30FPS