python实现‘读取语音文件’

最近看了很多语音预处理的博客,参考了很多语音读取代码,如下:

# 导入相应的包
import numpy, wave
import matplotlib.pyplot as plt
import numpy as np
import os

filename = 'E:/dataSet/casia/liuchanhg/angry/201.wav'  #添加音频文件的路径
f = wave.open(filename,'rb')# 打开音频文件,以得到语音参数
                                      # #getparams:一次性返回所有的WAV文件的格式信息
params = f.getparams()                # 得到语音参数,一次性返回所有的音频参数,返回的是一个元组,wave模块只支持非压缩的数据

nchannels, sampwidth, framerate,nframes = params[:4]# 得到的数据是字符串,需要将其转成int型
                                                    # nchannels:音频通道数,sampwidth:每个音频样本的字节数,framerate:采样率,nframes:音频采样点数
strData = f.readframes(nframes)    #指定需要读取的长度(以取样点为单位),返回的是字符串类型的数据。读取波形数据

#将波形数据转换为数组                                    # 通过np.fromstring函数将字符串转换为数组,通过其参数dtype指定转换后的数据格式
wavaData = np.fromstring(strData,dtype=np.int16)       # dtype指数组元素类型;将读取的字符串数据转换为一维short类型的数组。
                                                      
wavaData = wavaData * 1.0/max(abs(wavaData)) #归一化
wave_add=np.append(wavaData[0],wavaData[1:]-0.97*wavaData[:-1])   #预加重
wave_add= np.reshape(wave_add,[nframes,nchannels]).T   # .T 表示转置

f.close()

我也还有很多不懂的地方,希望跟大家一起学习。

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值