浅谈人工智能 | 语音识别面面观

本文介绍了语音识别技术的工作原理,从模拟音频到数字信号的转换,以及其在现代生活中的广泛应用,如智能手机和智能家居设备。随着技术进步,语音识别的准确性和功能不断提升,但也面临背景噪音和同音词误识别等问题。从1976年的初步尝试到现在的广泛使用,语音识别已成为人工智能领域的重要组成部分。
摘要由CSDN通过智能技术生成

语音识别是指机器/程序接收、解释声音,或理解和执行口头命令的能力。随着人工智能和智能助手(如亚马逊的Alexa,Apple的Siri和微软的Cortana)的崛起,语音识别已经得到了广泛应用。

语音识别系统使消费者只需通过与之交谈即可与技术进行交互,从而实现免提请求、提醒和其他简单任务。

语音识别的工作原理

计算机上的语音识别软件要求将模拟音频转换为数字信号,称为模数转换。计算机如要解密信号,必须具有单词或音节的电子数据库或词汇表,以及用于将该数据与信号进行比较的快速手段。语音模式存储在硬盘上,并在程序运行时加载到内存中。比较器依据A/D转换器的输出检查这些存储的模式,是模式识别的动作。

在这里插入图片描述

实际上,语音识别程序的有效词汇量的大小与安装它的计算机的随机存取存储器容量直接相关。如果将整个词汇表加载到RAM中,与搜索硬盘驱动器中的某些匹配项相比,语音识别程序的运行速度要快许多倍。处理速度也很关键,因为它会影响计算机在RAM中搜索匹配的速度。

虽然语音识别技术起源于个人电脑,但它在移动设备和智慧家产品的商业领域都获得了认可。智能手机的普及开启了向消费者口袋添加语音识别技术的机会,而家庭设备,如Google Home和Amazon Echo,将语音识别技术带入了客厅和厨房。语音识别与日益稳定的物联网传感器相结合,为以前缺乏智能功能的许多消费产品增加了技术优势。

随着语音识别技术的使用变得更频繁,以及更多用户与之交互,有语音识别软件的公司将拥有更多的数据和信息,以供给支持语音识别系统的神经网络,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值