2-人的发声原理和听觉原理

专注音视频

已于 2022-02-20 20:58:31 修改

阅读量1.6w

点赞数 2

分类专栏：音频技术栈文章标签：音视频听觉形成原理发音原理

于 2022-02-20 20:55:51 首次发布

本文链接：https://blog.csdn.net/wu5215080/article/details/123035787

版权

音频技术栈专栏收录该内容

4 篇文章

订阅专栏

本文详细阐述了人体发声的过程，包括肺部气流、声带振动和语音形成，以及语音分类。同时，介绍了人耳的结构和听觉原理，包括外耳、中耳、内耳的功能，以及声音如何转化为神经信号。此外，还探讨了听觉特性如响度、音调和掩蔽效应。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

不知道是否大家跟我一样有好奇过，人是怎么发出声音？然后声音又是怎么传输到对方？最终到对方耳朵是怎么听到这些声音进而产生回应？

这里拿一个比较常见的打电话这个场景举例，总结其实就以下这几个问题：

1）人体是怎么发出声音
2）声音产生出来是怎么进行传输
3）又是怎么听到声音？
4）听到声音后又是怎么处理这些声音的信息？

这篇文章里面主要是介绍人的发声音和听觉原理。

一）人体的发声原理：

1.1 人体发音器官结构示意图：

下图就是整体人体发声的不同区域部分，主要分以下几大块：

口腔区：
鼻腔区
咽腔区
喉头声带区：
气管区

人类用来产生语音的发音器官自下而上包括肺部（lung）、气管（trachea）、喉（larynx）、咽（pharynx）、鼻腔（nasal cavity）、口腔（oral cavity）和唇（lip）。它们作为整体形成了一个连续的管道。其中，

声道：喉部以上的部分称为声道，就是声音传播所通过的地方。，随着发出语音的不同其形状是变化的。发音的声道主要是指我们的三个腔体，即咽腔、口腔和鼻腔。

声带：在喉部从喉结到杓状软骨之间的韧带褶，称为声带（vocal cords）。声带既是一个阀门，又是一个振动部件。一般声带的长度为10~14mm

声门：喉的部分称为声门。喉部的声带既是一个阀门，又是一个振动部件。呼吸时，左右声带打开，说话时声带合拢。两个声带之间形成一个开闭自如的声门（glottis），声门的开启和关闭是由两个杓状软骨控制，说话时合拢的声带受声门下气流冲击而张开。

发音步骤过程：

1）肺部气流的形成：
2）声源(声带振动)：
3）语音形成

1）肺部气流形成：肺是胸腔内的一团有弹性的海绵状物质，它可以储存空气。通过正常的呼吸系统空气可以进入肺部，在说话时腹肌收缩使横膈膜向上，挤出肺部的空气，形成气流。肺部呼出的气流是语音产生的原动力

2）声带振动：由于声带具有一定的韧性，可以迅速闭合。当气流通过气管和支气管经过咽喉时，收紧的声带由于气流的冲击产生振动，不断地张开和闭合，使声门向上送出一连串喷流。这时的气流被截断成准周期的脉冲，一般用非对称的三角波表示。声带的振动取决于其质量。质量越大，每秒振动次数越小；反之，质量越小，声带振动越快。声带振动频率决定了声音的音高。声带振动产生声音，这是产生声音的基本声源，称为声带音源（glottalsource）。

3）语音形成：声带音源被进一步调制后经过咽喉、口腔或者鼻腔。口腔的开合、舌头的活动和软腭的升降等发音动作，形成了不同的声道构形，从而发出不同的语音。最后，由嘴唇开口处将语音辐射出去

语音是由声源和声道共同作用产生的。

按照声源的不同我们把语音分成以下两大类：

第一类是声带振动作为声源产生的声音，我们把它们叫做浊音。比如拼音中的 “a，o，e” 等。
第二类是由气体在经过唇齿等狭小区域由于空气与腔体摩擦而产生的声音，我们把它们叫做清音。比如拼音中的 “shi、chi、xi” 等。

当声带处于放松状态时，有两种方式能发出声音。

其中一种方法是通过舌头，在声道的某一部分形成狭窄部位，也称为收紧点，当气流经过这个收紧点时会产生湍流，形成噪声型的声音。这时对应的收紧点的位置不同及声道形状的不同，形成不同的摩擦音。
利用舌头和嘴唇关闭声道，暂时阻止气流，当压力非常高时，突然放开舌与唇，气流被突然释放产生的短暂脉冲音。对应于声道闭紧点的不同位置和声道的形状，形成不同的爆破音。

二）人耳的听觉原理

声音是由物体振动产生的，通过空气、固体、液体等介质进行传输的一种声波，可以被人耳识别的声波的范围是 20Hz~20000Hz 之间，也叫做可听声波，这种声波称之为声音，根据声波频率的不同可以主要分为：

可听声波：20Hz~20kHz
超声波：> 20kHz
次声波：< 20Hz

此外，人的发声范围一般是 85Hz~1100Hz。

外界物理声波通过耳廓，传到耳道，振动鼓膜。鼓膜推动锤骨-砧骨-镫骨，再将振动传递到耳蜗，从而转换为神经电信号，通过听觉神经传入大脑。

2.1、耳朵的结构：

人耳由外耳（outer ear）、中耳（middle ear）和内耳（inner ear）三部分组成，如下图所示。其中外耳、中耳、内耳的耳蜗部分是听觉器官。内耳的前庭窗和半规管部分是判定位置和进行平衡的器官。

外耳：

构成：外耳由耳翼（pinna）、外耳道（external auditory meatus）和鼓膜（eardrum）构成
- 耳翼的作用是保护耳孔，其卷曲状具有定向作用
- 外耳道
外耳作用：一是对声源的定位；二是对声音的放大。
- 外耳道的共振效应，会使声音得到10dB左右的放大
- 头的衍射效应也会增大鼓膜处的声压，总共可以使声音得到20dB左右的放大
- 外耳道对声波的共振频率可以计算如下：共振峰频率＝声音速度/声音的波长。外耳道的长度大约是25mm，声波波长的长度是它的4倍，声速是340m/s，因此外耳道共振峰频率＝（1000×340）/（4×25）＝3400Hz，即外耳道的共振峰频率大约是3400Hz

中耳：

构成：主要由鼓膜后面的一个小小的骨腔里有锤骨（malleus）、砧骨（anvil）和镫骨（stapes）三块听小骨组成，还通过咽鼓管联通鼻腔和外界联系
中耳作用：
- 一个是通过听小骨进行声阻抗的变换，放大声压；
- 另一个是保护内耳。
保护作用的原理：
- 中耳鼓室和咽鼓管相连，咽鼓管能维持鼓膜内外大气压的平衡。在一定的声强范围内，听小骨实现声音的线性传递，而在特强声时，听小骨实现声音的非线性传递，以达到保护内耳的作用

内耳：

构成：由半规管（semicircular canal）、前庭窗（oval window）和耳蜗（cochlea）组成，其中前庭窗和半规管属于本体感受器，与机体的平衡机能有关
- 半规管：半规管是三个半环形小管，相互垂直，类似于一个三维坐标系统。
  - 它们分别称为上半规管、外半规管和后半规管，半规管内的感受器能感受旋转变速运动的刺激，而前庭窗内的感受器能感受静止的位置和直线的变速运动
- 前庭窗：
- 耳蜗是听觉的受纳器，形似蜗牛壳，由蜗螺旋管旋转两圈半构成，耳蜗很小，蜗螺旋管总长只有3cm。内耳的结构复杂，又称为迷路。
- 以上三部分的外表由骨质形成，称为骨迷路；
  - 套在骨迷路内的膜性管称为膜迷路。
  - 骨迷路和膜迷路形态大致一样，关系就好像自行车车轮的外胎和内胎。膜迷路内有内淋巴液；膜迷路和骨迷路之间有外淋巴液
耳蜗：
- 耳蜗很小，蜗螺旋管总长只有3cm。内耳的结构复杂，又称为迷路
- 耳蜗里的膜迷路有感声的毛细胞，它可以把声音刺激变成神经冲动，经听神经传入大脑的听觉中枢完成语音的感知功能
- 耳蜗中有一个重要部分称为基底膜（basilar membrane），基底膜在靠近前庭窗的部分硬而窄，而在靠近耳蜗孔的部分软而宽。
- 基底膜之上是柯蒂氏器官（organ of corti），它相当于一种传感装置，耳蜗内的流体速度变化，可以影响柯蒂氏器官上的毛细胞膜两边电位的变化，在一定条件下造成听觉神经的发放和抑制，从而完成机械振动向神经发放信号转换的过程。

2.2、听觉是怎么形成？

完整的声音感知过程：

形成过程：

外耳（负责收集外界的物理生硬，并传递到中耳）
- 1）由外耳道传入鼓膜，鼓膜是一张有弹性的圆形膜
- 2）声音传到鼓膜会产生振动，鼓膜振动传到中耳
中耳：（负责增强和放大声音的振动，将声波的振动传递给内耳）
- 三块软骨组成的听小骨链，形成从鼓膜到内耳的桥梁
- 听小骨相互作用，增加和放大声音的振动
内耳：(把中耳的物理声音信号转换为生物电信号并传递给大脑中枢神经系统)
- 声波传到内耳中，通过前庭窗使耳蜗内的淋巴液产生振动
- 淋巴液带动其中的毛细胞产生运动，毛细胞的运动产生了电信号
- 电信号通过听觉神经传递给大脑中枢神经系统，大脑感知到开始评估处理信号，就形成了神奇的听觉

2.3、听觉特性：

人的听觉特性主要可以分为下面几点：响度，音调，掩蔽效应

响度
- 响度就是反映一个人主观感觉不同频率成分的声音强弱的物理量，单位为方（phone）
音调
- 音调是听觉分辨声音高低时，用于描述这种感觉的一种特性，客观上用频率来表示音调，主观上感觉音调的单位是采用美（Mel）标度
- 一般对于频率低的声音，听起来觉得它的音调低，而频率高的声音，听起来感觉它的音调高。但是音调和频率并不是成正比的关系，它还与声音的强度及波形有关
听觉掩蔽
- 掩蔽的定义：
  - 它指的是在一个较强的声音附近，相对较弱的声音将不被人耳觉察，即被强音所掩蔽。较强的音称为掩蔽者，弱音称为被掩蔽者
  - 人耳听觉特性的研究大多在心理声学和语言声学领域内进行。实践证明，声音虽然客观存在，但是人的主观感觉（听觉）和客观实际（声波）并不完全一致，人耳听觉有其独有的特性
- 掩蔽现象是一种常见的心理声学现象，是由人耳对声音的频率分辨机制决定的
- 同时掩蔽：
  - 同时掩蔽指掩蔽现象发生在掩蔽者和被掩蔽者同时存在时，也称为频域掩蔽
- 异时掩蔽
  - 异时掩蔽效应发生在掩蔽者和被掩蔽者不同时存在时，也称为时域掩蔽