近几年,语音识别技术逐渐走向成熟,越来越多的互联网公司及硬件厂商在布局智能语音的商业版图。万物互联的浪潮势不可挡,智能语音技术在汽车、智能家居、教育等各个领域全面开花。
智能语音从何发展至今?当前面临怎样的机遇与挑战?未来又将发展成什么样的形态?本次我们访谈了OPPO资深语音架构师Elon,他将为我们介绍智能语音技术的完整发展路径。
Q1:能否简单介绍一下语音技术的发展历程呢?
早在计算机发明之前,1920年便有了“Radio Rex”玩具狗这种早期的语音识别雏形,可以视为人类对智能语音技术的初次探索;而真正意义上基于计算机的智能语音技术发展最早可追溯至20世纪50年代,从1952年第一个语音识别系统Audrey诞生到现在已走过了近70个年头,早期主要是贝尔实验室、伦敦学院等学术机构在做该方向的布局;到20世纪90年代前后,出现了全球首个非特定说话人的大词汇量连续语音识别系统Sphinx,以及后来一度被学术届普遍使用的剑桥HTK等开源工具;当时中国高科技发展计划863计划也启动,语音识别作为智能计算机系统研究的重要方向之一,被专门列为研究课题;20世纪末至21世纪初,a是语音识别快速发展、从学术界逐步走向产业化的阶段,大概在2009年左右,深度学习在语音技术领域发力,识别效果取得了很大突破;2011年苹果手机虚拟助理Siri诞生,之后的10年时间里,语音相关技术和团队开始从学术界走到工业界,不管是互联网公司还是传统硬件厂商,都开始布局智能语音技术,并逐步落地了Alexa、Google Assistant、天猫精灵、小度小度、小爱同学等一系列众所周知的智能语音交互产品。
纵观整个智能语音交互技术的发展历程,从一开始只支持非常简