python时域转频域_语音预处理（二）：时域转频域

最新推荐文章于 2023-09-21 17:15:50 发布

weixin_39628594

最新推荐文章于 2023-09-21 17:15:50 发布

阅读量1.8k

点赞数

文章标签： python时域转频域

一.时域转频域

这节主要介绍如何经过傅里叶变换将音频转到频域，以便于后续的特征提取和识别。先后进行加窗、分帧、FFT和取log操作。

输入：音频矩阵wavsignal ，帧率fs

例：[[1507 1374 1218 ... -78 -127 -43]],16000

输出：转成频域后的音频矩阵data_input

二.代码：

#coding=utf-8

import os

import wave

import numpy as np

import matplotlib.pyplot as plt

import math

import time

from python_speech_features import mfcc

from python_speech_features import delta

from python_speech_features import logfbank

from scipy.fftpack import fft

def read_wav_data(filename):

"""

:param filename:输入音频的绝对路径(路径+文件名)例：D:\\GitHub\\wav\\dae\\train\\A2_1.wav

:return:wave_data,framerate:输出音频矩阵，帧率。例：A2_1 [[1507 1374 1218 ... -78 -127 -43]]

读取wav文件，返回声音信号的时域谱矩阵和播放时间

"""

wav =

最低0.47元/天解锁文章

weixin_39628594

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
python时域转频域_语音预处理（二）：时域转频域

一.时域转频域这节主要介绍如何经过傅里叶变换将音频转到频域，以便于后续的特征提取和识别。先后进行加窗、分帧、FFT和取log操作。输入：音频矩阵wavsignal ，帧率fs例：[[1507 1374 1218 ... -78 -127 -43]],16000输出：转成频域后的音频矩阵data_input二.代码：#coding=utf-8import osimport waveimport ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。