语音识别技术论文阅读笔记

2021.03.24

论文:语音识别技术人工智能毕业论文(作者:)

 

笔记:

1.语音识别技术应用领域:声控电话交换、信息网络查询、家庭服务、医疗服务、银行服务、工业控制、语音助手、语音通信系统等。

2.语音识别的基本方法:(1)基于声道模型和语音知识的方法。最早。

                                     (2)模板匹配的方法。

                                               动态时间规整(DTW)、隐马尔可夫(HMM)理论、矢量量化(VQ)技术。

                                     (3)神经网络的方法。

3.语音识别系统的结构:(1)语音信号预处理与特征提取

                                     (2)声学模型与模式匹配

                                     (3)语音模型与语言处理

4.语音识别主要问题:(1)自然语言的识别和理解。(2)语音信息量大。(3)语音的模糊性。(4)语音具体含义受上下文的影响大。(5)环境噪声干扰大。

 

论文:语音识别技术的发展及应用(作者:于晓明)

笔记:

1.发展历程:

        20世纪50年代 我国语音技术出现 国外也只是贝尔实验室简单的英语单词发音装置---->20世纪70年代 语音识别实质性进展  主流隐士马尔科夫模型技术 (HMM)  从传统目标匹配方式向基于统计数学化方向发展------>20世纪80年代  语音识别技术进一步发展   模式识别出现人工神经网络   从简单词语识别到连续语音识别和大量词语的识别   我国863计划 与国外同步发展-------> 20世纪90年代  语音识别技术成熟  基于BP神经网络  语音识别产品出现。

2.语音识别构建模型:

                                             预处理  、特征提取                                     模式匹配、判决

                      语音信号-------------------------------------------> 模式库---------------------------------------->判决结果

     语音信号预处理:1.语音信号预加重 。目的提高信号和噪声信号的比度,很好的对语音信号进行滤波。

                                  2.加窗分帧。(汉明窗)为得到语音信号的分析频谱,将持续的语音信号分成多段信号。

                                  3.端点监测。很好的区分 正常的语音信息、有间断的信息、有无声信息。排除其他选取正常的语音信息。

     语音信号的特征提取:(特定的倒谱特征)经典的LPCC和MFCC两个参数。

     模式匹配判决:   声学模型(发音)

                                 语言模型(语法结构)

3.语音识别应用领域: 智能家居、公安、购物、银行、车载、门禁、身份识别。

4.技术突破:噪声问题(难题)提高鲁棒性。

5.发展前景:语音识别系统将说话方的语言通过语音识别技术显示给听力受限的人群  作用类似助听器。经济有效。

论文:简单语音识别的实现过(作者:陆昱方)

笔记:

1.语音识别定义:就是指让机器通过识别和理解过程把语音信号转变为相应的文本信息或命令信息的高科技技术。

2.语音识别应用领域:工业、通信、智能家居、汽车、医疗、电子产品、公安系统等。

3.语音识别功能:

                         (1)语音输入系统:声音信号转化为电信号输入到计算机中。

                          (2)语音控制系统:语音信息以电流的形式输入计算机后,计算机根据数据库里的内容进行匹配。

3.语音识别实现过程:

      预处理--->传感器(声音信号到电信号)---->加工成二进制 。

     语音识别方法:HMM、ANN

      特征参数:线性预测编码系数、短时频谱、短时平均幅度、短时平均能量。

       贝叶斯原理:P(B|A)=P(AB)/[P(AB)+P(AB(上划线))]

                          定理是关于随机事件A和B的条件概率的。能找出频率最高的断句方式。

4.语音分析:就是语音识别分词断句的过程。

4.优势:高效性、迅速性、便捷性。

5.问题: (1)技术不成熟  因口音识别出错 

               (2)噪音

               (3)语音歧义, 要求语音识别的词组库要有更快的更新速度。叠词。

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值