热爱之所以有力量就在于,你坚守它就好,永远不要去想它会有什么结果。
目录
前言
这里是对《Sound Event Detection: A Tutorial》做的笔记。
论文地址:https://arxiv.org/pdf/2107.05463.pdf
一、声音事件检测的简单介绍
声音事件检测的目的就是识别出一个音频中声音事件的种类,以及检测出声音事件发生和结束的时间。如下图所示:
二、声音事件检测的挑战
1、音事件有非常不同的声学特征,有些声音很短,比如枪声,有些声音很长,比如说话声等等。
2、在声音事件检测的实际应用中,需要检测的声音距离麦克风很远,导致麦克风接收到的目标事件的声压级低于环境中发生的其他声音的声压级,增加了检测的难度。
3、生活中发生的声音事件通常是多音的,意味着多个声音事件会在同一时间发生,也增加了检测的难度。
4、音频数据量少,并且标注困难,耗时大。导致目前音频数据集无标签的数据多,有标签的数据很少。
三、声音事件检测通用的机器学习方法
处理声音事件检测任务的主要方法是基于监督学习的,下图展示了一个用于声音事件检测的监督学习的通用分类系统。
正如