前言
音频数据处理学习(一)
一、音频的采样率,采样点,音频帧
- 采样率就是单位时间内采样的点的个数 比如40Khz表示每秒钟可以采样40k个点
- 采样点就是采样过程中获得的某一时刻原始模拟声波在某一时刻的振幅状态
- 音频帧是指定采样点数值的一组状态值,比如1024个采样点为一帧(和图片不同,图片是一张一帧)
- 帧率是一秒放了多少帧。
二、频率HZ
- 赫兹是国际单位制中频率的单位,它是每秒钟的周期性变动重复次数的计量
- 物体在一秒钟之内振动的次数叫做频率,单位是赫兹,字母Hz。人的耳朵可以听到20 ~ 20000Hz的声音,最敏感是200~800Hz之间的声音。
三、语音信号的一些特征参数
-
能量相关参数
- 表示的是某段短时间内信号振幅的均方值
-
过零率相关参数
- 表示的是一帧信号波形穿过横轴的次数
-
归一化自相关参数
- 反应了信号中相隔K个点的两个样本点值 的相关程度
-
基音周期
- 提取语音的基音
-
谱特征
- 反应的是声音的频率变化特征
<