降噪测试过程中，测试语音选择的思考

最新推荐文章于 2024-06-29 00:33:12 发布

置顶 zeark

最新推荐文章于 2024-06-29 00:33:12 发布

阅读量3.6k

点赞数

分类专栏：降噪语音增强文章标签：降噪测试语音测试序列降噪浊音清音

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012514944/article/details/89350777

版权

降噪同时被 2 个专栏收录

13 篇文章 7 订阅

订阅专栏

13 篇文章 11 订阅

订阅专栏

最近一直在测试降噪效果，也花了很多时间，借鉴同事以及资料，自己通过测试比较，有一些感悟，分享出来，希望音频算法的同行一起讨论。

降噪效果测试，正常情况我们会更多注重在噪声分类上面，往往忽略了语音音素的选择，这里我分享下，其实音素在降噪效果的比较中，我们应该要重视起来，以下我先来谈谈一些音素的区别以及降噪的影响：

1、几种音素的分类：

浊音：指发音时声带有震动的音素,比如au,o。

清音：与浊音相反，主要是通过通过气流来发音，声带不震动，比如：s,p。

元音：发音过程中由气流通过口腔而不受阻碍发出的音，分类有双元音，半元音。

辅音：与元音相对，气流在口腔或咽头受到阻碍而形成的音，分类有鼻音，鼻塞音，摩擦音等。

2、降噪主观测试序列音素的选择：

在降噪过程，如果条件合适，我们的测试训练需要包括所有的音素，并且需要保持3倍以上的量，当然，正常情况下，我们肯定很难做到这么多的测试序列一遍一遍的听，根据我的感受，我们至少需要包含以下几种：

中文测试：中文发音，语音的持续时间比较长，很多降噪算法对音素的损伤偏小，但是我们还是需要确保我们的测试序列中包含足够多的清音，比如：4，7，10，服等。

英文测试：相对于中文，英文每一个音素的发音延续时长就要短很多，清音出现的概率也更大，所以对英文测试时，我们就需要包含更多的音素，而且需要包含重读、轻读的单词，比如s 发音在单词前面，中间以及后面。还需要特别注意闭塞音：浊闭音：发音时长往往特别短10～20ms,能量往往还比较低，在做瞬时噪声处理时，把握不好就会损伤严重，清闭塞音：40～100ms,这个时间相对也比较短，而且频谱上往往就是一根竖线，在噪声处理时也很容易造成损伤。另外就是摩擦音，由于能量强度低，频谱平坦，即使一些对平稳噪声降噪的方法，也会很容易对这部分发音损伤。

snr: 语音测试训练，不同信噪比的带噪语音，对测试失真也很重要。

欢迎大家加音频算法分享讨论群：153268894 （作者 zeark）。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zeark CSDN认证博客专家 CSDN认证企业博客

码龄11年

28: 原创

7万+: 周排名

210万+: 总排名

10万+: 访问

: 等级

1340: 积分

111: 粉丝

25: 获赞

59: 评论

179: 收藏

私信

关注

热门文章

分类专栏

最新评论

深度学习抑制啸叫
inprogram: 你用的是transformer吗？
rnnoise 运行报错解决
大头儿: ValueError: Unknown initializer: initializer 您好，这个怎么解决呀
rnnoise 训练步骤
神无袖: 层主我看了你帖子的评论，也是有差不多的问题，用au看了原作者的噪声库发现噪声幅值差距很大，然后他的c文件输入没有标准化，语料也是-10~20dB随机混合，VAD也是能量VAD,给人感觉准确率很低，训练后的VAD loss就比降噪loss大很多并且下不来，推断的时候语音尾段有噪声残留，有babble的时候效果更差。我试过把VAD权重调大但是loss就下不来，调的小静端降噪效果会变差，不知道你之前重新给vad打标签能不能改善，还是说直接把混合噪声的幅值调小一点？还有我用了差不多8M帧数据这个数据量是不是有点少了
rnnoise 训练步骤
RoadmanG: 他这个是把训练音频合成两个文件，我觉得这样很麻烦，我改成在文件夹里面找数据的形式了，具体的看我别的博文，里面有github
rnnoise 训练步骤
神无袖: 你好请问chopper.c和noise_chooper.c文件是哪来的？源码里好像没有。作者好像也不提供数据了。如果是自己实现的话signal.raw和noise.raw是把数据拼成一行吗？是做成什么类型的文件呢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。