python批量添加不同噪声(可调节不同信噪比)
在进行一些语音任务时,可能需要对我们的语音信号进行加噪,难免会用到批量对语音信号进行加噪,下面我实现了使用python批量对语音文件进行加噪,希望能对大家有所帮助.
import os
import soundfile as sf
import numpy as np
import math
from tqdm import tqdm
def file_name(file_dir):
L = []
for root, dirs, files in os.walk(file_dir):
for file in files:
if os.path.splitext(file)[1] == '.wav':
filename=os.path.join(root, file)
# print(get_label(filename))
L.append(filename)
return L
def add_noise(clean_data, noise_data,noised_filename, SNR, sr=16000):
# data align
if(len(clean_data)>len(noise_data)):
times=math.ceil(len(clean_data)/len(noise_data)) #向上取整
noise_data=list(noise_data)*times
noise_data=np.array(noise_data)
noise_data=noise_data[:len(clean_data)]
#计算语音信号功率Ps和噪声功率Pn1
Ps = np.sum(clean_data ** 2) / len(clean_data)
Pn1 = np.sum(noise_data ** 2) / len(noise_data)
# 计算k值
k=math.sqrt(Ps/(10**(SNR/10)*Pn1))
#将噪声数据乘以k,
random_values_we_need=noise_data*k
#将噪声数据叠加到纯净音频上去
outdata=clean_data+random_values_we_need
# 将叠加噪声的数据写入文件
sf.write(noised_filename, outdata, sr)
以下是程序主函数,如果使用的话,需要更改一下几个变量
clean_dir
:纯净文件的存放位置
noise_dir
:噪声文件的存放位置
output_dir
:加噪后的语音文件输出到该文件夹下
SNR_list
:要添加的信噪比,可以为正,为负,为0
if __name__ == '__main__':
clean_dir='./release_dev_final_1_after_drc/wav' #纯净信号(.wav文件)
noise_dir='./split_noise' #要添加的噪声(.wav文件)
output_dir='./noised/' #加噪后的语音路径(.wav文件)
SNR_list = [30, 27, 25, 23, 20, 17, 15] #要添加的信噪比
clean_files=file_name(clean_dir)
noise_files=file_name(noise_dir)
for clean_filename in tqdm(clean_files):
# create one random SNR
SNR_index = np.random.randint(0, len(SNR_list))
SNR = SNR_list[SNR_index]
# choose one random noise type
random_index=np.random.randint(0,len(noise_files))
noise_filename=noise_files[random_index]
noise_type=(noise_filename.split('\\')[1]).split('.wav')[0]
clean_type=(clean_filename.split('\\')[-1]).split('.wav')[0]
noised_filename=output_dir+clean_type+'_'+noise_type+'_'+str(SNR)+'dB.wav'
#读取音频
clean_data,fs=sf.read(clean_filename)
noise_data,fs=sf.read(noise_filename)
# add noise
add_noise(clean_data,noise_data,noised_filename,SNR,fs)
在这里需要修改main函数中的那几个路径和信噪比就可以批量添加啦~,祝大家使用愉快。