语音识别是指机器/程序接收、解释声音,或理解和执行口头命令的能力。随着人工智能和智能助手(如亚马逊的Alexa,Apple的Siri和微软的Cortana)的崛起,语音识别已经得到了广泛应用。
语音识别系统使消费者只需通过与之交谈即可与技术进行交互,从而实现免提请求、提醒和其他简单任务。
语音识别的工作原理
计算机上的语音识别软件要求将模拟音频转换为数字信号,称为模数转换。计算机如要解密信号,必须具有单词或音节的电子数据库或词汇表,以及用于将该数据与信号进行比较的快速手段。语音模式存储在硬盘上,并在程序运行时加载到内存中。比较器依据A/D转换器的输出检查这些存储的模式,是模式识别的动作。
实际上,语音识别程序的有效词汇量的大小与安装它的计算机的随机存取存储器容量直接相关。如果将整个词汇表加载到RAM中,与搜索硬盘驱动器中的某些匹配项相比,语音识别程序的运行速度要快许多倍。处理速度也很关键,因为它会影响计算机在RAM中搜索匹配的速度。
虽然语音识别技术起源于个人电脑,但它在移动设备和智慧家产品的商业领域都获得了认可。智能手机的普及开启了向消费者口袋添加语音识别技术的机会,而家庭设备,如Google Home和Amazon Echo,将语音识别技术带入了客厅和厨房。语音识别与日益稳定的物联网传感器相结合,为以前缺乏智能功能的许多消费产品增加了技术优势。
随着语音识别技术的使用变得更频繁,以及更多用户与之交互,有语音识别软件的公司将拥有更多的数据和信息,以供给支持语音识别系统的神经网络,