语音增广(Audio Agument)

常见语音增广库

audiomentations

GitHub - iver56/audiomentations: A Python library for audio data augmentation. Inspired by albumentations. Useful for machine learning.

AugLy

GitHub - facebookresearch/AugLy: A data augmentations library for audio, image, text, and video.

nlpaug

GitHub - makcedward/nlpaug: Data augmentation for NLP

rubberband

GitHub - breakfastquay/rubberband: Official mirror of Rubber Band Library, an audio time-stretching and pitch-shifting library.

三种常用增广形式及其推荐库

音量变换

推荐:AugLy

import soundfile as sf
import augly.audio as audaugs
import numpy as np

file_path = "D:/3513-163606-0019.flac"
output_path = 'D:/new.wav'

volume_change = np.random.uniform(5,8)   #音量改变值
augmented_data, sr = audaugs.change_volume(audio=file_path, volume_db=volume_change)
sf.write(output_path, augmented_data, sr) #写入保存
     

音调变换及速度变换

推荐:rubberband(笔者下载的是rubberband命令行程序)

import subprocess
import librosa
output_file_path = 'D:/new.wav'
file_path = "D:/3513-163606-0019.flac"

rubberband_command = [
               'D:/rubberband/rubberband.exe',
               '-t', '1',  # 调整速度,1为原速
               '-p', '-1',     # 调整音调,0为原调
               file_path,
               output_file_path
           ]
# 运行 rubberband 命令
subprocess.run(rubberband_command, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
data, sr= librosa.load(file_path)
agumented_data, augmented_sr = librosa.load(output_file_path)

  • 6
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值