背景需求
在处理音频中,我们可能会有这样的场景:随着语音设备的能力越来越强,音频数据越来越大。但实际上,音频中的有效部分却很少,抑或是音频的背景声过大,非目标声音。在这样的场景下,我们希望得到人声,去掉噪声,提高信噪比。
问题界定
这里将问题进行界定,进行子任务拆分:
- 将音频的背景声音去除,
- 去除“无声”阶段。
解决方案
以保持最高的信噪比。这以需求在很多场景中有见:比如课堂录音的提取,或者是录音笔的数据存储。
在使用本领域“高深”的技术前,一定要思考,切莫手上有锤子,就看啥都像钉子。想想该领域的专家会怎么做,如何从专业角度看待该问题;其次想想普通人会怎么做,防止落入经验主义陷