Kaldi当中语音数据增强有什么方法

最新推荐文章于 2022-10-22 23:02:06 发布

翁卓

最新推荐文章于 2022-10-22 23:02:06 发布

阅读量1.7k

点赞数 4

本文链接：https://blog.csdn.net/libeicuo8108/article/details/106062745

版权

整理知乎 https://www.zhihu.com/people/leonjin 回答，如侵权立删

音速扰动sp：将音频速度扩展为0.9,1.0,1,1

参考脚本utils/data/perturb_data_dir_speed_3way.sh

音量扰动vp：

参考脚本utils/data/perturb_data_dir_volume.sh

上面两个都是用sox实现

有加混响和加性噪声，参考脚本

steps/data/reverberate_data_dir.py

steps/data/augment_data_dir.py

http://www.openslr.org/resources/28/rirs_noises.zip
这个混响包含了real和simulated，用的比较多是simulated中的小房间，中房间，对应房间大小分别是1~10m和10~30m加性的：
http://www.openslr.org/resources/17/musan.tar.gz
这个加性包含人声babble，音乐背景声和真实噪声。这两个噪声库强烈推荐Mark上~另外就是用sox改改音速和音量，这些dither也可以纳入考虑

2019年新加的频谱augmentation，内嵌在xconfig中：

spec-augment-layer

该方法需要加大epoch才可能奏效

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

翁卓

关注关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
Kaldi当中语音数据增强有什么方法

整理知乎https://www.zhihu.com/people/leonjin回答，如侵权立删音速扰动sp：将音频速度扩展为0.9,1.0,1,1参考脚本utils/data/perturb_data_dir_speed_3way.sh音量扰动vp：参考脚本utils/data/perturb_data_dir_volume.sh上面两个都是用sox实现有加混响和加性噪声，参考脚本steps/data/reverberate_data_dir.pysteps/...
复制链接

扫一扫