语音已经逐步成为人们与人工智能互动的重要界面,人工智能落地的新篇章正在书写,而语音争夺的焦土战则早已全面爆发。
语音识别(语音转文字)是语音文本类深度学习应用类别之一,包括语音命令,语音听写和语音转录。语音命令往往比较短,例如“我要王菲的听歌”等等。语音听写则是对近场清晰语音的人对机听写,需要有一定的实时性。
各大硅谷巨头都在争相发展语音入口
苹果Siri依托于iPhone,以苹果手机的数量不难得出Siri拥有比任何人工智能语音助手都更加庞大的基础平台这个结论。
亚马逊Alex则依托于Echo设备。2017年的节日促销, Echo智能音箱家族整体表现亮眼,成了购物季的“明星礼物”,一举拿下全球亚马逊销量最高的商品。这两家都已经在消费普及方面取得了明显的领先优势。而谷歌在搜索方面依然占据领先优势,人们渐渐用语音搜索来代指谷歌的语音技术,整合语音功能的新款软件有Assistant,语音工具有Voice Search。
任何一家硅谷巨头都认定:不能在这个即将到来的生态系统大战中失败。
BAT人工智能的棋局纷纷落子语音入口:
-
百度语音交互平台Duer OS全面进行开源,百度有基于语言识别和自然语言处理的度秘 DuerOS,所有技术驱动力来自百度大脑,无论是算法还是模型、架构。
-
阿里智能语音助手AliGenie,阿里人工智能实验室认为AliGenie的优势之处在于语义理解,仅一项关于天气的询问就可以理解700多种中文问法。
-
腾讯叮当,不仅在于语音交互,更希望以语音为基础,结合视觉与听觉,在原有的“手机助手式”的语音交互上进行叠加配合,真正实现场景化下的高效互动。
另外,to C语音战场的还有搜狗。搜狗建立以语言为核心的人工智能技术,通过问答、语音和翻译更形态应用于搜索和输入法等产品中,把语音输入集成到手机输入法中。
尽管棋局输赢未定,BAT巨头语音领域落子,毫不犹豫。
术业专攻,有人主打语音技术
凭借语音输入、语音识别等NLP方面的功底,科大讯飞家的“网红输入法”,6年囊获了5亿用户。自此