深度丨语音识别技术专利申请分析及关键技术展望(上)

原标题:深度丨语音识别技术专利申请分析及关键技术展望(上)

语音识别作为人工智能的重要分支技术,因其使用场景亲民而备受关注,它的技术目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。

本文首先对语音识别的现有技术进行梳理和总结,然后从专利申请趋势、主要申请人与发明人及其相关技术、关键技术等方面对语音识别中国专利申请情况进行统计分析。最后,对语音识别技术的国内申请情况进行总结。

由于本文干货充足篇幅较长,为方便大家阅读分享故分上、下两篇进行推送。今天推送的是第一部分,包括:语音识别技术概述、语音识别技术专利申请现状。

关键词:语音识别 ASR

一.语音识别技术概述

(一)研究背景

语音识别是从待识别语音信号中识别出该语音的语义信息、语言信息和说话人特征信息和情感信息等。语音识别技术是模式识别研究领域中一个非常重要组成部分,它涉及到许多学科,包括计算机、通信、语音语言学、电子技术和模式识别等众多学科。

随着科技的进步,人们通过大量的研究,在理论、算法、实验中通过不断地努力和改进,取得了许多重要的科学成果。

二十世纪五十年代,AT&T贝尔实验室的语音识别研究首次取得成功,该系统可以识别出一到十的英文数字,语音识别作为一颗新星正式在历史舞台现身。二十世纪六十年代,随着计算机等技术应用的不断发展和创新,迅速推动了语音识别技术的发展。

75fa649e7db246fba04138fd6d7edeb1.jpeg

其中线性预测技术和动态规划技术的出现使得语音识别有了新的突破:前者解决了信号模型的问题,后者则解决了不等长的语音匹配问题。

以动态时间规划(DTW)为代表的语音识别技术成为上世纪七十年代语音识别领域的新突破。此时的线性预测技术获得了更进一步的发展,动态时间规划技术也逐渐成熟。新理论的提出又为语音识别添上了新的翅膀:矢量量化与隐马尔科夫模型成为语音识别理论中的佼佼者。另一方面,实践中以LPC和DTW结合实现了的孤立词语音识别系统。

上世纪八十年代,语音识别的研究硕果累累,其中HMM模型和基于神经网络技术模型在语音识别中取得新的突破。识别的算法从模板匹配转为基于统计的模型,模型也从基于规则转变为基于统计描述。连接词汇的语音识别系统、连续语言的语音识别系统不断发明出来。一九九八年CMU大学在VQ/HMM基础上幵发的非特定人连续语音识别系统SPHINX可以识别997个词汇。

2bbb993ee02f47349b5eab6f6172c744.jpeg

上世纪九十年代又有了新的成果,语音识别开始往大词汇量、非特定人识别的方向挺进。1993年,DARPA使用具有两万词汇量的华尔街杂志语料库(Wall Street Journal Corpus)进行识别系统评估,它包含2.6万词汇的Switchboard语料库,是一个电话交谈语音库。在1998年,DARPR使用英语电台、电视新闻节目录音等资源库对广播新闻语料迸行评估,这里面包含了各种复杂背景噪音,信号失真以及口音问题,使得识别的难度大大增加。在这些识别系统中,剑桥大学的HTK系统对于低噪声部分评测具有较高的识别率,其准确率达到92.2%,而法国国家实验室的LIMSI在自然语言发音部分的识别率最高,达到85.4%。

语音识别技术关键技术不断的取得新的突破,识别技术日渐成熟。在计算机技术、电信行业应用等领域的推动下,实用化的语音识别系统及与此相关的语音服务应用走上历史舞台。

各个行业技术的迅速发展使得语音识别技术也随之达到一个高的水平,在稳健性、自适应性方面语音识别不断地从实验室走向实用产品。这一时期,语音识别的关键性特征为非特定人大词汇连续语音识别的高识别率。英国剑桥大学的HTK系统在理想语音库下的准确率超过95%;其另一个语音识别系统在广播语音的

识别率达到83.8%;美国卡内基梅隆大学的系统对于大词汇量的电话语音的识别误识率为45.1%,这些系统是语音识别系统中小词汇表现最佳的典范。

国内语音识别在上世纪七十年代以中国科学院声学所为先驱,实用电子管电路识别出十个元音,开启了国内语音识别的新天地

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值