部分音频特征



在本文件夹的 low-level features and timbre文本有有对相应的特征参数代表的物理意义的解释

来自文献 全自动中文新闻字幕生成系统的设计与实现

频谱质心(spectral centroid,SC)频谱能量的集中点,一般来说,此值越小,说明越多的能量集中在低频范围内。

频谱差分幅度(spectral flux,SF)一个音频段中的相邻两帧之间谱的平均变化量

频谱截止频谱(spectral roll off frequency,SRF)把频率小于等于该值的所有信号的能量相加,其和为总能量的固定比例(可设定)

频谱峰度(spectral kurtosis,SK)描述频率分布曲线形态陡缓程度的统计量

梅尔频率倒谱系数(mei-frequency cepstral coefficients,MFCC)在梅尔频率尺度上进行频谱分析,梅尔频率尺度与实际频率关系为 Mel(f) =2595lg(1+f/700)。

线性预测倒谱系数(linear predictive cepstral coefficients,LPCC)由线性预测系数变换得到。线性预测的基本思想:用过去的p个样点值来预测未来的样点值。

短时能量均方值(root-mean-square,RMS)一帧的短时能量的均方值

过零率(zero-crossing rate,ZCR)一帧中信号波形穿过横轴(零电平)的次数

高过零帧比率(high zero-crossing rate ratio,HZCRR)一个音频段内过零率超过zcr值的帧数目,zcr值为所有帧的过零率平均值的1.5倍

低能帧比率(low short-time energy ratio,LSTER)一个音频段内能量低于此段内短时能量平均值0.5倍的帧数目

噪音帧比率(noise frame ratio,NFR)一个音频段内噪声帧所占比例

谱矩(spectral moments,SM)

http://www.audiocontentanalysis.org/code/


  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值