与计算机视觉CV相对应,计算机听觉computer audition,简称CA。
Dcase
这里推荐一个社区:DCASE(Detection and Classification of Acoustic Scenes and Events)
https://dcase.community/
Dcase introduction:
DCASE 2023研讨会是第八次声学场景和事件的检测和分类研讨会,与DCASE挑战赛一起组织。该研讨会旨在为从事声音事件计算分析和场景分析的研究人员提供一个展示和讨论其结果的场所。目标是将来自许多不同大学和公司的对该主题感兴趣的研究人员聚集在一起,并提供科学交流思想和意见的机会。
dcase2024有10个主题的任务:
Task 1
Data-Efficient Low-Complexity Acoustic Scene Classification
数据高效的,低复杂度的,声学场景分类
Task 2
First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring
首次无监督的异音检测,用于设备状态监测
Task 3
Audio and audiovisual sound event localization and detection with source distance estimation
具有音频源头距离估计的 音频和视听声音事件 定位和检测
Task 4
Sound event detection with heterogeneous training dataset and potentially missing labels
使用异构训练数据集和潜在缺失标签的声音事件检测
Task 5
Few-shot Bioacoustic Event Detection
小样本生物声学事件检测
Task 6
Automated Audio Captioning
自动生成音频字母
Task 7
Sound Scene Synthesis
声景合成
Task 8
Language-Based Audio Retrieval
基于语言的音频检索
Task 9
Language-Queried Audio Source Separation
基于语言查询的音频源分离
Task 10
Acoustic-based traffic monitoring
基于声学的交通监控
和工业智能比较相关的是task2和task4
ASD
异音检测ASD,即 Anomalous Sound Detection 。
人耳听音的缺点:
- 人的主观因素大,同一个声音,有的人觉得有问题,有的人觉得没问题;
- 人疲劳的时候,会误判
- 长期听音对人耳会造成不可逆的伤害
硬件设备
麦克风-非接触式
听诊器-接触式
reference:
https://pu.cgmia.org.cn/News/Detail/11832 听棒介绍
声级计(异音一般在频谱中很抢眼)
频谱检测对机械振动/异音检测尤其有效,但对于扬声器这种由外部信号激发发声的电声产品就不太奏效。电声测试需要完整的信号激励和分析系统。
也会使用振动加速度传感器。
骨传导麦克风-接触式 (海康工业听诊套装,听诊器+算法舱)
关于环境噪音:
背景音如果和要检测的声音的频率不在一个范围,则没事,比如当时即使有人说话,但不影响高速旋转时候的异音。
但如果有些工厂的敲击金属声音、车辆振动声音,频率和检测对象音重叠,则不行。
产品商
https://www.ntiaudio.cn/
https://baijiahao.baidu.com/s?id=1642468411707097318 内含方案介绍
https://www.puseng.net/ant-test
https://t.cj.sina.com.cn/articles/view/3009742660/vb3650744019015jm6 方案介绍
异音检测–杭州爱华
方法
频谱检测
高次谐波失真面积计算
斜率突变计算
常用模型:HMM GMM
常用特征:MFCC MPEG-7
reference:https://blog.csdn.net/yjjat1989/article/details/44961279
制造业应用场景
基于声信号进行结构损伤检测
托辊异常声音检测
电极压缩机异音检测
刀具磨损状态监控
判定轴承与齿轮等是否异常
压力管道、容器泄露(石油管道,热力管道,压力锅炉)和定位
zenodo
再分享一下zenodo平台,
Zenodo作为一个开放获取的数字存储库和数据存储平台,可以看相关文献
reference:
https://zhuanlan.zhihu.com/p/646962108
音频事件检测
reference:
https://zhuanlan.zhihu.com/p/343528946 展示效果好,并且有开源代码。