地震:谷歌如何用“神经网络”改造Android

地震:谷歌如何用神经网络改造Android

  当谷歌开发最新版的Android移动操作系统(http://www.gec-edu.org/#)时,这家网络巨头对这个操作系统解读用户语音命令的方式作出了一些重大的改变。当时谷歌基于所谓的神经网络安装了一个语音识别系统,这个神经网络是一种计算机化的学习系统,在很大程度上能像人脑那样运作。

  负责开发这个项目的谷歌研究科学家文森特·凡毫克(Vincent Vanhoucke)称,对许多用户来说,谷歌作出的这种改变所带来的影响非常大。这个项目在某种程度上让我们感到惊喜,表明我们只需要改变下模式就能取得相当大的改善。他说道。

  凡毫克表示,与此前版本的Android系统(http://www.gec-edu.org/#)相比,最新Jelly Bean语音识别系统的误差率要低25%左右,而且能让用户更加愿意使用语音命令。他表示,目前用户在使用智能手机语音服务时倾向于使用更加人类化的语言;也就是说,用户越来越不像是跟机器人对话。这个语音识别系统正在改变人们的行为方式。凡毫克说道。

  这只是神经网络算法正在改变科技产品运作方式以及用户使用方式的例子之一。在二十世纪八十年代,这一领域中的研究工作曾是最热门的研究领域之一,但随后已经沉寂了多年时间,现在则已卷土重来,微软和IBM与谷歌都在探索这种算法能应用于哪些领域。

  当用户向Android操作系统的语音识别软件说话时,声音频谱会被分解并发送到谷歌全球服务器大军中的八台电脑,随后由凡毫克及其团队开发的神经网络模型进行处理。谷歌非常擅长把这种庞大的计算工作分解开来,然后非常迅速地进行处理;为了做到这一点,谷歌让杰夫·迪恩(Jeff Dean)及其.下的工程师团队负责相关工作,这个团队以善于彻底改造现代数据中心的运作方式而闻名。 神经网络给凡毫克等研究人员带来了一种分析海量模式——Jelly Bean的例子中是用户语言的频谱——的方式,然后预测一种全新的模式可能代表着什么。神经网络这个比喻来自于生物学,神经元会与生物体中的其他细胞构成网络,允许其以专业的方式处理信号。在Jelly Bean所使用的神经网络中,谷歌可能通过分析庞大的现实世界数据的方式构建了多个语言运作的模式——比如说英语语音搜索请求的模式等。

  人们在很长时间里都相信——之所以会有这种想法,一部分原因是基于我们在人脑中看到的东西——想要获得一个良好的感知系统,那么你就必须使用多层功能。多伦多大学的计算机科学教授杰弗里·辛顿(Geoffrey Hinton)说道。但问题在于,你能如何以有效的方式来学习这些东西。

  Android系统接收语音命令,然后谷歌使用神经网络模式来对其进行处理,来判断用户的语音内容。谷歌的软件首先会尝试挑选出用户语音中的各个部分,也就是组成单词的不同类型的元音和辅音,这是神经网络的一个层面;然后谷歌软件会使用这些信息来作出更加复杂的猜测,每一层都会推动其更加接近于弄明白用户说的是什么。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值