背景需求
在处理音频中,我们可能会有这样的场景:随着语音设备的能力越来越强,音频数据越来越大。但实际上,音频中的有效部分却很少,抑或是音频的背景声过大,非目标声音。在这样的场景下,我们希望得到人声,去掉噪声,提高信噪比。
![9137a79e4cb2ba65550e9aeacd338ef2.png](https://i-blog.csdnimg.cn/blog_migrate/aca72cc58dcbe6ccb5e6efda6e1fc9de.jpeg)
问题界定
这里将问题进行界定,进行子任务拆分:
- 将音频的背景声音去除,
- 去除“无声”阶段。
![8670455d5469e5338f4a98937ab464cf.png](https://i-blog.csdnimg.cn/blog_migrate/f9813ceae816657c7e7bf500f15908a0.jpeg)
解决方案
以保持最高的信噪比。这以需求在很多场景中有见:比如课堂录音的提取,或者是录音笔的数据存储。
在使用本领域“高深”的技术前,一定要思考,切莫手上有锤子,就看啥都像钉子。想想该领域的专家会怎么做,如何从专业角度看待该问题;其次想想普通人会怎么做,防止落入经验主义陷