(done) 声音信号处理基础知识(7) (Understanding Time Domain Audio Features)

参考:https://www.youtube.com/watch?v=SRrQ_v-OOSg&t=1s


时域特征包括:
1.幅度包络
2.均方根能量
3.过零率
在这里插入图片描述

振幅包络的定义:一个 frame 里,所有采样点中最大的振幅值
在这里插入图片描述

一个形象的关于振幅包络的可视化解释如下:
在这里插入图片描述

可以观察到,振幅包络对 异常值 较为敏感。这个特征也可以用于异常值检测,或者音乐体彩分类。
在这里插入图片描述

接下来是均方根能量,公式如下:
在这里插入图片描述

均方根能量可以作为 响度 的一个指示,它相比 AE 振幅包络,对异常值不敏感
RMS 通常用于声音信号切片,音乐体裁分类
在这里插入图片描述

zero crossing rate 过零率的定义如下:信号穿过 x 轴的次数
在这里插入图片描述

公式如下(前面放个 1/2 是有理由的,因为 +1 - (-1) = 2):
在这里插入图片描述

这个特征可以用来识别 打击声音和 尖锐声
也可以用来评估单声道声音的音高
还可以在一段对话信号中识别 人声
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值