3. 实战数字音频处理——HIFI DSP 的定点FFT/IFFT以及加窗和OLA操作实践2

geastwind1

已于 2024-08-09 19:40:13 修改

阅读量498

点赞数 12

文章标签：实时音视频 dsp开发

于 2024-08-09 19:04:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/geastwind1/article/details/141067156

版权

1. 分帧和加窗

从mic处收到的语音是连续的模拟信号，经过放大和AD采样之后，变成16bit位宽的连续的数字信号。而我们在处理数据的时候是按照固定长度来处理的，一方面便于设计算法，另一方面也是处理流程的要求。这个固定长度截断数据叫做分帧(Frame)。

分帧不是完全一刀刀把数据截成多块，而是用过去的数据和新的数据拼起来。新数据的长度叫做帧移(Frame Shift)，中的长度叫帧长。一般我们取帧移为帧长的一半，这样利用效率最高。

分帧后的数据需要加窗，就是和一个长度一样的固定数据相乘。窗的类型有hamming窗，hanning窗等，加窗的主要目的一是为了降低频谱的泄露,二是为了保证信号的连续性。

我们在这里用512的帧长，256的帧移，窗口采用hamming窗。汉明窗的获得用python或matlab得到（也可以自己写C代码实现）：

import numpy as np
import torch
N=512
win=np.hamming(N)
win=torch.tensor(win*2**31).int()

这里可以看出，win是Q31定点格式的。

接下来，对AD输入的数据分帧操作：

memcpy(input, &input[256], sizeof(q15_t)*256); //把旧数据前移256
memcpy(&input[256], newdata, sizeof(q15_t)*256); //和256个新数据拼在一起

这样一来，一帧要处理的数据就得到了。

接下

最低0.47元/天解锁文章

关注

12
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
3. 实战数字音频处理——HIFI DSP 的定点FFT/IFFT以及加窗和OLA操作实践2

从mic处收到的语音是连续的模拟信号，经过放大和AD采样之后，变成16bit位宽的连续的数字信号。而我们在处理数据的时候是按照固定长度来处理的，一方面便于设计算法，另一方面也是处理流程的要求。窗的类型有hamming窗，hanning窗等，加窗的主要目的一是为了降低频谱的泄露,二是为了保证信号的连续性。返回nshift表示Spec表示的频谱数据要右移nshift才是真正的值，相当于输出的频谱Spec中的数据被放大了2^nshift倍，提高了后续的计算精度。在这里，我们进行了一个简单的变化，把幅度变为一半。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

geastwind1 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。