深度综述 棋局输赢未定,基于深度学习的语音识别已是焦土混战

语音已经逐步成为人们与人工智能互动的重要界面,人工智能落地的新篇章正在书写,而语音争夺的焦土战则早已全面爆发。

语音识别(语音转文字)是语音文本类深度学习应用类别之一,包括语音命令,语音听写和语音转录。语音命令往往比较短,例如“我要王菲的听歌”等等。语音听写则是对近场清晰语音的人对机听写,需要有一定的实时性。

各大硅谷巨头都在争相发展语音入口

苹果Siri依托于iPhone,以苹果手机的数量不难得出Siri拥有比任何人工智能语音助手都更加庞大的基础平台这个结论。

亚马逊Alex则依托于Echo设备。2017年的节日促销, Echo智能音箱家族整体表现亮眼,成了购物季的“明星礼物”,一举拿下全球亚马逊销量最高的商品。这两家都已经在消费普及方面取得了明显的领先优势。而谷歌在搜索方面依然占据领先优势,人们渐渐用语音搜索来代指谷歌的语音技术,整合语音功能的新款软件有Assistant,语音工具有Voice Search。

任何一家硅谷巨头都认定:不能在这个即将到来的生态系统大战中失败。

BAT人工智能的棋局纷纷落子语音入口:

  • 百度语音交互平台Duer OS全面进行开源,百度有基于语言识别和自然语言处理的度秘 DuerOS,所有技术驱动力来自百度大脑,无论是算法还是模型、架构。

  • 阿里智能语音助手AliGenie,阿里人工智能实验室认为AliGenie的优势之处在于语义理解,仅一项关于天气的询问就可以理解700多种中文问法。

  • 腾讯叮当,不仅在于语音交互,更希望以语音为基础,结合视觉与听觉,在原有的“手机助手式”的语音交互上进行叠加配合,真正实现场景化下的高效互动。

另外,to C语音战场的还有搜狗。搜狗建立以语言为核心的人工智能技术,通过问答、语音和翻译更形态应用于搜索和输入法等产品中,把语音输入集成到手机输入法中。

尽管棋局输赢未定,BAT巨头语音领域落子,毫不犹豫。

术业专攻,有人主打语音技术

凭借语音输入、语音识别等NLP方面的功底,科大讯飞家的“网红输入法”,6年囊获了5亿用户。自此

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

松鼠协会总动员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值