matlab 语音 解卷 同态滤波,通信中的语音信号处理复习大纲

《通信中的语音信号处理》复习大纲

北科大版

1、了解语音信号处理的目的、实质和发展历史;

实质:是研究用数字信号处理技术对语音信号进行处理的一门学科

目的:通过处理得到一些反映语音信号重要特征的语音参数以便高效地传输或储存语音信号所包含的信息。

通过对语音信号进行某种运算以达到某种要求。

发展历史:1876年电话的发明,贝尔(Bell);

1939年声码器的研制成功—声源+声道;

1947年贝尔实验室发明语谱图仪—语音识别研究的开始;

50年代第一台口授打字机和英语单词语音识别器;

60年代出现了第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器;

70年代动态规划技术、隐马尔可夫模型、线性预测技术和矢量量化码书生成方法用于语音编码和识别;

80、90年代语音处理技术产品化—IBM Tangora-5和Tangora-20英语听写机,Dragon Dictate 词汇翻译系统(70000),汉语听写机。

CMU语音组研制成功SPHINX系统(997,95.8%);

国内,清华大学、中科院声学所和中科院自动化所在汉语听写机研究方面有一定成果。

(除了属于这种LPC[线性预测分析法]的方法外,还开发了各种数字语音处理方法。到目前为止,相继实现了语音编码、语音分析、语音合成、语音修正、语音识别、说话者识别等各种具体应用系统。)

2、理解和掌握语音信号的表示和处理方法,常用的语音编码的采样率和相应的数字语音信号的速率;

1.语音表示方法的选择:要保存语音信号中的消息内容;表示形式要便于传输和存储、变换和处理,不至于严重损害消息的内容,

有用信息更易于被提取;

2. 语音信号数字表示的优点:

数字技术能完成许多很复杂的信号处理工作;

语音可以看成是音素的组合,具有离散的性质,特别适合于数字处理;

数字系统具有高可靠性、价廉、紧凑、快速等特点,很容易完成实时处理任务;

数字语音适于在强干扰信道中传输,易于和数据一起在通信网中传输,也易于进行加密传输。

3. 语音信号的数字表示方法:波形表示—采样和量化,保持波形;参数表示—激励源和模型参数(第二章)

语音信号的特点—短时平稳性

4. 处理方法:短时时域处理方法—短时能量、短时平均过零率以及短时自相关函数计算

短时频域分析—短时傅立叶分析

线性预测技术—本质上属于时域分析方法,但其结果可以是频域参数

倒谱和同态分析、矢量量化和隐马尔可夫模型

5. PCM编码:采样率:8000次/second,均匀量化:采样率12bps信号速率96kbps,非均匀量化:采样率8bps信号速率64kbps

ADPCM:采样率:8khz速率:32kbps

3、理解语音信号的产生过程、发生机理和语音信号的声学特性;

产生过程:语音是说话人和听者之间相互传递的信号,传递的媒介是声波,说话人的发音器官做出发声动作,接着空气振动形成声波,声波传到听者的耳朵里,立刻引起听者的听觉反应

发生机理:

声学特性:频率:与音高有关;振幅:与响度有关。

4、理解和掌握语音信号浊音的基音频率、共振峰,及共振峰的计算方法;

浊音的基音频率(F0):由声带的尺寸、特性和声带所受张力决定,其值等于声带张开和闭合一次的时间的倒数。人类基音频率的范围在60Hz至450Hz左右。

共振峰(formant):声道是一个谐振腔,当激励的频率达到至声道的固有频率,则声道会以最大的振幅振荡,此时的频率称之为共振峰或共振峰频率。声道具有的一组共振峰,声道的频谱特性主要反映出这些共振峰的不同位置以及各个峰的频带宽度。共振峰及其带宽取决于声道某一瞬间的形状和尺寸,因而不同的语音对应于一组不同的共振峰参数。实际应用中,头三个共振峰最重要。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值