“Echo这么火,为什么迄今为止却没有中国版的Echo?”这是许多互联网行业人士和媒体同仁们爱讨论的问题,得出的原因有很多。今天百度AI开发者大会上推出的“DuerOS开放平台”则回答了另外一个问题:“如何让中国版Echo成为可能?”。
为何迄今为止没有中国版Echo问世?
虽然大多数中国用户还没有机会一睹真容,但Echo算得上是一款现象级硬件,在美国很火。
2016年,“互联网女皇”玛丽·米克尔(Mary Meeker)的互联网趋势报告就已明确指出在智能手机销量下滑之后,智能音箱会是下一个增长点,Echo销量将会迎来腾飞。2016年6月时Echo销量已达到400万台。市场研究公司eMarketer的预测显示,亚马逊Echo系列产品今年有望独占美国智能音箱市场70.6%的份额,Google Home占据23.8%的份额,美国活跃用户今年将翻倍达到3650万人,照此推算Echo活跃用户则将达到2500万。
看到Amazon Echo风生水起,Google Home在去年入局,后知后觉的苹果在今年6月的WWDC上发布HomePod,最新消息显示搭载Bixby智能助理的三星智能音箱也将面世。全球科技巨头争夺智能音箱产品,不过迄今为止中国公司却进展缓慢。不乏有创业者自诩为“中国版Echo”,但从市场反馈来看,目前还没有一家智能音箱真正走向普及,能够被称得上中国版Echo。我在体验了一些国内智能音箱之后,不论是从理解能力还是服务体验来看,都很初级甚至弱智,找不到买单的理由。
核心原因是什么?在我看来有两点。一个是技术的门槛,Echo的核心技术是智能语音交互,创业公司甚至大多数科技巨头,都不具备这样的技术实力,Echo和Alexa到现在已投入四年时间,雇佣超过1000名员工,苹果HomePod发布之后上市还要年底,可见一个小小的音箱要真正智能还是需要大量技术投入的。另一个是服务的要求,Echo的背后是Amazon Prime会员服务、流媒体版权内容服务以及电商服务,创业公司和科大讯飞这样的专业巨头不具备服务整合能力。
因此,迄今还没有一家称得上“中国版Echo”的智能音箱玩家。
DuerOS开放平台让中国版Echo成为可能
DuerOS开放平台则让上述问题迎刃而解,其分为小度智能设备开放平台和小度技能开放平台,前者侧重自然对话技术,让音箱、冰箱、电视等设备接入后具备基于上下文的自然语音对话交互能力,确保硬件或者App能听清、听懂;小度技能开放平台则提供包括影音娱乐、信息查询、生活服务等在内的10大品类、100+个原生技能,同时支持第三方资源和内容接入(比如音乐内容),进而确保硬件和App在听懂用户表达意图后可以满足需求,可见这两个平台正好应对到上述两个棘手问题。
为了提供更好的语音交互能力,百度还宣布全资收购专注于语音唤醒的AI初创公司KITT.AI,并将其设备唤醒能力整合到DuerOS开放平台,开放给开发者,只需三步、一分钟就可快速构建“唤起词”。百度还发布了DuerOS开发套件,分为个人版、轻量版、标准版等不同版本,支持多麦克风阵列,帮助智能硬件开发者快速构建具有智能对话能力的智能设备。
因此中国版Echo或将很快成为现实,尤其是智能音箱创业者、传统音响公司,可以接入DuerOS开放平台,规避短板进而聚焦在硬件等领域。现在看来2017年很可能成为中国智能音箱元年:iPhone 2007年诞生但真正开始普及到中国也是2010年的事情了,魅族、联想、小米等公司开始加入到智能手机研发阵营中。Echo从诞生到普及已有四年左右,谷歌、苹果等巨头入瓮,中国市场现在必然会进入普及期,DuerOS开放平台的推出会加速进程。今天阿里AI实验室还发布了名为“天猫精灵X1”的智能音箱,基本沿袭了Echo的思路,同时也进行了本地化的改造。百度DuerOS开放平台的思路则是催生更多的Echo,而不是自己做了自己卖。
需要明确的是,DuerOS开放平台不只是想要驱动音箱能听会说,还可兼容一切有语音交互需求的设备和场景,比如电视、汽车、门锁、陪伴机器人,以及客服、服务业、窗口服务等行业应用场景,这意味着它将与专业语音公司直面竞争。
语音公司是DuerOS开放平台的潜在对手
说到语音人们第一个想到的公司很可能会是科大讯飞,这家做语音起家且专注于语音的公司在合肥,一直比较低调。但在语音领域却已耕耘多年,积累深厚。一方面,语音技术尤其是中文语音识别技术已很成熟。另一方面,其业务多元化发展,但企业级市场是重头戏,在教育、客服等领域积累了诸多客户资源。
百度DuerOS开放平台将不得不面对与科大讯飞的竞争——因为一个设备不需要两只耳朵、两个大脑、两张嘴巴。这让我联想到2013年百度地图和高德的导航免费大战:百度地图导航免费后引发与高德的口水战,最终结局是大家都走向了免费,我们今天都不需要为手机导航花钱,DuerOS开放平台也将会与科大讯飞争抢客户,而且也是采取免费手段,这是互联网平台的惯用手段。
本质上DuerOS开放平台要做的事情与科大讯飞还是不同的。如果只是语音开放,百度在2013年就已经开始了,DuerOS开放平台不是开放语音技术,而是基于上下文的对话交互能力——不只是语音识别,还有语义理解,视觉交互和自然语言交互,且与语音公司最大不同是在技术之外还有能力整合,就是小度技能开放平台,这是百度对开发者的一个吸引力。不过,科大讯飞早已意识到AI对于语音的重要性,启动“讯飞超脑”等项目重攻AI,因此它依然会是DuerOS开放平台乃至百度AI开放的重要竞争对手。
互联网公司语音开放之路或成必然
如果说交互是一个市场,那么现在占据这个市场的应该是输入法,但语音交互可不是下一代输入法它是一种人机交互方式,更应该被对应到操作系统——智能音箱是用安卓还是iOS是不重要的,因为用户根本不会用触摸或者键盘鼠标去与之交互,用户与音箱交互的唯一界面就是语音,人机交互界面就是操作系统的本质,它意味着用户与设备的连接权、与互联网的连接权,以及与互联网背后的服务的连接权,就是我们常说的入口。
谷歌在智能手机时代无忧微软却多虑,就是因为谷歌有Android。中国公司在移动操作系统上基本都踏空,手机公司在做ROM但控制权还是在谷歌手里,阿里巴巴YunOS正在物联网场景中突围以求大器晚成。现在我们看到,中国互联网巨头在“语音交互”这个“操作系统”上比国外巨头更积极。
智能音箱国外巨头走得更快,Amazon Echo之后,Google Home、苹果HomePod相继入局,三星的推出已是板上钉钉。我们会看到,这些公司倾向于做音箱、然后卖出去,进而获取入口,打造封闭体系,每家都想做智能音箱的iPhone或者Kindle,就连习惯于开放的Google也在走这条路,从用Pixel取代Nexus品牌来看,谷歌对于硬件的态度早已不是“Demo”心态而是要自己做自己卖了。跟DuerOS开放平台同一天发布的阿里“天猫精灵X1”同样采取了通过硬件做闭环生态的思路。
也有例外,微软倾向于开放路线,它在去年底宣布会将Cortana开放给第三方硬件公司,包括音响、汽车和家电公司,首款“吃上Cortana”的第三方产品是哈曼卡顿的Invoke音响在今年的Build 2017年大会上展示。有消息称谷歌在去年也叫了50多家知名家用电器品牌开了个会来讨论语音能力的开放,其中包括一些家庭音响的明星品牌,不过目前没有实质动作——要注意的是,谷歌Home 和Google Assistant已经启动的开放策略,跟Siri开放一样,指的是让智能家居等设备或者互联网服务更好地通过Google Home或Google Assistant与用户交互,与语音能力的开放不是一回事。
百度DuerOS开放平台则是第一个面向全设备、全场景的智能交互开放平台——微软只对音箱有了Cortana语音助理的开放,DuerOS开放平台背后涉及到百度的语音技术、视觉交互技术、自然语音处理技术等等,提供多种开发者套件,还有就是互联网内容和服务能力,且不只是面向智能音箱。从这个角度来看,DuerOS开放平台有其前瞻性和领先性。
在百度AI开发者大会上,TCL、海信等来自不同领域的设备公司,以及创业型开发者甚至个人创客都表示会基于DuerOS开放平台打造语音应用。更早之前,小度(DuerOS)已经与HTC、vivo等智能手机品牌,小鱼在家、海尔、美的等智能家居品牌,以及智能汽车、行业应用等领域的玩家达成合作,基于语音自然交互的开放AI生态初漏雏形。以百度在AI技术上的积累和实力,以及服务内容整合能力,我想DuerOS开放平台不只是会让“中国版Echo”成为可能,更会让智能交互无处不在。
"