语音信号的LPC特征提取

1588 篇文章 1590 订阅

语言是人类创造的,是人类区别于其他地球生命的本质特征之一。语音是语言最本质、最自然、最直接的表现形式或载体,其表现形式为声波—一种由空气分子振动而形成的机械波。人类用语言交流的过程可以看成是一个复杂的通信过程,为了获取便于分析和处理的语音信源,必须将在空气中传播的声波转变为包含语音信息并且记载着声波物理性质的模拟(或数字)电信号,即语音信号,因而语音信号就成为语音的表现形式或载体。

语音识别的研究工作大约开始于上个世纪50年代。1952年贝尔实验室首次研制成功能识别10个英语数字的孤立词语音识别系统——Audry系统。20世纪60年代中期,一系列数字信号处理方法和技术成为语音信号数字处理的理论和技术基础。在方法上,随着电子计算机的发展,以往的以硬件为中心的研究逐渐转化为以软件为主的处理研究。

20世纪70年代,有几项研究成果对语音信号处理技术的进步和发展产生了重大的影响:70年代初,日本人板仓提出动态时间伸缩算法(DTW),使语音识别研究在匹配算法方面开辟了新思路;70年代中期,线性预测技术(LPC)被用于语音信号处理,隐马尔可夫模型(HMM,Hidden Markov Model)法也获得初步成功,该技术后来在语音信号处理的多个方面获得巨大成功;70年代末,Linda,Buzo,Gray和Markel等人首次解决了矢量量化(VQ)码书生成的方法,并首先成功得将矢量量化技术用于语音编码。从此矢量量化技术不仅在语音识别、语音编码和说话人识别等方面发挥了重要作用,而且很快推广到其他许多领域。

80年代,语音识别研究进一步走向深入,首先是声学建模的方式由基于模板的方法全面向统计建

  • 4
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fpga和matlab

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值