深度综述 棋局输赢未定,基于深度学习的语音识别已是焦土混战

语音识别已成为人工智能领域的焦点,硅谷巨头如苹果、亚马逊、谷歌和BAT均在此布局。尽管技术已取得显著进步,如识别率提升至97%以上,但在复杂环境和特定场景下仍面临挑战。科大讯飞、思必驰等企业以语音技术为核心,推动产业发展,而深度学习和自然语言理解的进步将持续改变语音交互的未来。
摘要由CSDN通过智能技术生成

语音已经逐步成为人们与人工智能互动的重要界面,人工智能落地的新篇章正在书写,而语音争夺的焦土战则早已全面爆发。

语音识别(语音转文字)是语音文本类深度学习应用类别之一,包括语音命令,语音听写和语音转录。语音命令往往比较短,例如“我要王菲的听歌”等等。语音听写则是对近场清晰语音的人对机听写,需要有一定的实时性。

各大硅谷巨头都在争相发展语音入口

苹果Siri依托于iPhone,以苹果手机的数量不难得出Siri拥有比任何人工智能语音助手都更加庞大的基础平台这个结论。

亚马逊Alex则依托于Echo设备。2017年的节日促销, Echo智能音箱家族整体表现亮眼,成了购物季的“明星礼物”,一举拿下全球亚马逊销量最高的商品。这两家都已经在消费普及方面取得了明显的领先优势。而谷歌在搜索方面依然占据领先优势,人们渐渐用语音搜索来代指谷歌的语音技术,整合语音功能的新款软件有Assistant,语音工具有Voice Search。

任何一家硅谷巨头都认定:不能在这个即将到来的生态系统大战中失败。

BAT人工智能的棋局纷纷落子语音入口:

  • 百度语音交互平台Duer OS全面进行开源,百度有基于语言识别和自然语言处理的度秘 DuerOS,所有技术驱动力来自百度大脑,无论是算法还是模型、架构。

  • 阿里智能语音助手AliGenie,阿里人工智能实验室认为AliGenie的优势之处在于语义理解,仅一项关于天气的询问就可以理解700多种中文问法。

  • 腾讯叮当,不仅在于语音交互,更希望以语音为基础,结合视觉与听觉,在原有的“手机助手式”的语音交互上进行叠加配合,真正实现场景化下的高效互动。

另外,to C语音战场的还有搜狗。搜狗建立以语言为核心的人工智能技术,通过问答、语音和翻译更形态应用于搜索和输入法等产品中,把语音输入集成到手机输入法中。

尽管棋局输赢未定,BAT巨头语音领域落子,毫不犹豫。

术业专攻,有人主打语音技术

凭借语音输入、语音识别等NLP方面的功底,科大讯飞家的“网红输入法”,6年囊获了5亿用户。自此ÿ

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

松鼠协会总动员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值