语音识别基础知识一

1、人耳组成的三部分:

外耳:外耳包含耳翼和外耳道,耳翼具有定向作用,外耳道同其它管道一样也有共振频率,大约是3400Hz。鼓膜位于外耳道内端,声音的振动通过鼓膜传到内耳。

中耳:由三块听小骨组成,作用包括放大声压和保护内耳。中耳通过咽鼓管与鼻腔相通,其作用是调节中耳压力。

内耳:耳蜗实现声震动到神经冲动的转换,并传递到大脑。

2、听觉特性与音频信号

2.1人的听觉特性

①人对声音强弱的感觉

通过对人群测试发现,当声音信号的强弱按指数规律增长时,人会大体上感到声音在均匀地增强,即将声音声强取对数后,才与人对声音的强弱感相对应。根据人类听觉的这一特点,通常用声强值或声压有效值的对数来表示声音的强弱,称为声强级或声压级,单位为分贝。

②人对声音频率的感觉

人对声音频率的感觉表现为音调的高低,当声音的频率按指数规律上升时,音调的感觉线性升高。这意味着只有对声音信号的频率取对数,才会与人的音高感觉成线性关系。为了适应人类听觉的音高感规律,在声学和音乐当中表示频率的坐标经常采用对数刻度。

③人类听觉的频响特性

人类听觉频响的特点时声压级越高听觉频响越平直;随着声音声压级的降低,听觉频响变坏,低频响应下降明显。人的听觉频带为20Hz-20kHz,高于20kHz的声音称为“超声”,低于20Hz的声音称为“次声”。不论声压级高低,人对3-5kHz频率的声音最敏感。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值