python 语谱图生成_预处理数据(批量生成语谱图)

本文介绍了如何使用Python对语音信号进行预处理,批量生成语谱图,并去除图像白边。通过短时段分析和傅里叶变换,将声音波形转化为声谱图,详细展示了数据预处理、生成语谱图的代码实现以及去白边保存的方法。
摘要由CSDN通过智能技术生成

声谱图介绍:

处理语音信号很少直接利用录下來的整段语音波形(speech waveform),而是將波形沿着时间轴,每隔10毫秒切割出一小段长约20至30毫秒的波形來处理,称为短时段分析(short-term analysis),习惯上上把这些一小段波形称为「音框」(speech frame)。接着再针对每个音框进行傅里叶分析(Fourier analysis),傅里叶分析的主要目的在將时间上的波形拆解成数个不同頻率的弦波信号,利用这些弦波信号的振幅和相位來表示语音波形的特征;若将弦波信号的振幅绝对值取对数、並沿着頻率画圆,可得此音框的绝对值频率(magnitude spectrum)。將这些绝对值频率沿著时间排列,並以颜色深浅表示各弦波成份所佔的多少,我们即可得到声谱图(spectrogram)

语音信号预处理介绍:

python生成声谱图:

主要分为三部分,【批量数据预处理,生成语谱图,去白边保存】

1、批量数据预处理代码代码:

for root, dirs, files in os.walk(COOKED_DIR):

print("Root = ", root, "dirs = ", dirs, "files = ", files)

for filename in files:

print filename

path_one = COOKED_DIR+filename

f = wave.open(path_one,'rb')

params = f.getparams()

nchannels, sampwidth

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值