三、虚拟助手的竞争
Siri仅是充分竞争市场冰山的尖顶。Apple的产品在去年引发一波模仿和创新,有数十个智能手机应用。在报告中将分析Siri及另外4个应用:语言识别专家Nuance公司的Dragon Go,i-Free创新工场的可视化驱动Everfriends,人工智能创业公司Dexetra的iris,和AT & T实验室的Speak4bit。
我们统计了Android和iOS上43个虚拟助手应用,他们总共有133.3M(1.333亿)次下载。其中94%的下载是Android应用。Google的语音搜索——只有一次语音动作被执行的VA——在133.3M的下载中占了超过81%的下载量。即使除去语音搜索,Android应用仍在剩余的24.2M下载中占68%的比例。相反,iPhone和iPad应用有接近90%是付费下载,占VA应用收入的86%。VA总体收入宣称有$1.8M,就潜力而言,目前的收入是微薄的。
前十应用占总收入的42%。Pannous的Voice Actions单个就接近总收入的36%,仅随其后的是QuanticApps的Voice Assistant和True Knowledge的Evi。除了Pannous的Voice Actions,进入前十的付费应用只有AIVC和Speakto。这前十VA应用要么是语音识别厂商的产品,要么出自人工智能研究创业公司。Google和Naunce几乎为所有的前十应用提供语言识别引擎,只有一个应用例外,使用iSpeech。很多VA厂商承认曾尝试其他的引擎,比较过多个SR引擎,但在语音识别质量或报价上不满意。
对于VA任务和特性,我们定义了一些通用标准来分析。大部分VA具备本地搜索和通用搜索,包括天气预报,语言拨号和短信,包括联系人查找和导航。关键的VA特性,在十大应用中有广泛的实现,包括个性化,本地语种,访问第三方和本地内容。这些特性要求在研发中增加与技术公司的合作或者增加投资,以及拓展本地第三方内容合作。由于语音识别仍需大量研发,应用通常是由单个公司驱动。
对VA进行个性化,使之更似真人。Siri的讽刺个性肯定有助于模仿真人。部分应用使用定制化头像来加强VA的个性化。另一重要差异特性是访问第三方内容,典型的例子是Facebook,YouTube,Spotify,last.fm,或者是需求很大的本地内容。本地内容和本地语言支持是互相关联的特性。例如,Siri在美国工作良好,由第三方内容支持。但是在其他地区由于缺乏本地内容,娱乐性大为减弱。
表:Android是VA的平台选择
Dragon Go:Nuance进入消费者领域
“Nuance正投资在直接面对消费者领域,因为我们相信此是研究人们喜好,将创新推向市场的最快途径”Matt Revis,Nuance公司移动和电视部门的副总裁。
Nuance为Siri提供语言识别功能,公司传统的收入主要来自垂直行业。在过去两年,它还是在直接面向消费者领域有竞争对手,如Vlingo和SVOX Mobile Voices。它推出的面向消费者应用,有Dragon Serach,Dragon Dictation和Dragon Go,其中Dragon Go是首个Nuance商标的成熟的虚拟助手。Nuance目前也在车载、电视、台式机和手提电脑上进行研究,认为VA技术可部署在从照相机到微波炉的所有消费者电子产品。Dragon Go音乐和推荐的内容合作伙伴们将它作为内容发布平台。Nuance还通过B2B商务为面向消费者应用衍生了价值消费者洞悉和语音识别引擎训练。与此同时,它不断增长的B2C商务使它和它的客户直接进行竞争。
Everfriends:第三方服务和个性化
“根据互动特性建立的对话逻辑有助用户更加投入”Kirill Petrov,i-Free的创始者之一,和i- Free创新工场的领导者。
i-Free创新工提供是VA应用EverFriends,它是位于圣彼得堡的i-Free公司的子公司,i-Free公司提供出产手机应用和游戏并进行IT研究和风险投资。它认为目前的声控助手只是基于云的个人服务访问的垫脚石,可用于任何设备,使用自然语言和互动头像在用户和VA之间建立更深关系。Everfriends的不同的收入来源是研究VA商务模式的好例子:87%的收入来自第三方合作伙伴,5%来自广告,8%来自头像定制化。i-Free创新工场的核心关注点是头像定制化,它期待定制化收入会增长强劲。i-Free预期VA生态系统将向开放语音和自然语言API演进,因而允许第三方开发者创建衍生服务。它部署的计费能力、允许第三方交易也是第三方服务收入增长的关键因素。
Iris(alpha):最大独立厂商的VA应用
“手机不仅响应你,还可以和你说话” Narayan Babu,Dexetra公司的CEO。
在几个小时之前,Dexetra推出首个虚拟助手iris版本,将Siri的功能部署在Android手机上。目前,Dexetra大部分收入来自广告,它视OEMs和运营商为关键合作伙伴。Dexetra已经和Micromax签订许可合同,允许这个手机制造商将iris的印度版集成到设备。Dexetra计划与运营商共同建立应用商店。Dexetra计划在2012上半能够达到500K设备销售。公司正在开发基于上下文识别的内部beta版本,并在将来开发语音广告。此外,公司的Friday项目正在优化NLP引擎,这是beta版本内的项目,可搜索用户搜索历史,计划在2012年6月推出。
Siri:第一个大众市场上的嵌入式虚拟助手
“Siri的推出在虚拟助手市场上产生巨大的冲击,最重要的是,它是第一个大众市场下的自然语言处理”,Kirill Petrov, i-Free的联合创始人,i- Free创新工场的领导者。
Siri的推出促进了对声控助手的关注,更重要的是,它引发一波虚拟助手的创新,包括可下载的应用和业界的研究。有不少VA试图追随Apple的成功,诸如“Siri的朋友”,“Android上的Siri”或者“类似Siri”。根据4月份出版的Parkes Associates研究报告,1/3的美国iPhone 4S拥有者每天使用Siri进行电话呼叫、短信或搜索。其余的用户中,有87%每月至少使用一次Siri,绝大部分是语音呼叫、短信和信息搜索。
Siri的语音识别由Nuance提供,它的搜索结果由Wolfram Alpha提供。Siri和其他VA的区别在于,Siri完全嵌入iPhone的UI和核心应用,包括联系人和日历。作为领头的手机声控界面,Apple的下一步将在其他设备集成语音UI,从平板和传说中的Apple TV开始。Apple也在努力增加所支持的语种,这是成功实现本地搜索以及更重要的本地内容交易的关键因素。我们也了解到Apple的Siri引起Google的搜索流量的下降,我们相信这会促使Google推出免费的跨平台竞争产品。
Speak4it:创建多种模式VA
“结合手势和语音带来巨大的机会,Speak4it是目前唯一的提供多种模式理解的应用”,Mazin Gilbert,AT & T实验室的技术研究部副总裁助理
Speak4it是使用语音和手势识别的本地搜索应用。由AT&T是实验室开发,使用AT&T的“Watson”人工智能平台。公司认为虚拟助手将在未来3-5年内成为所有类型设备的自然接口。为实现这个愿景,AT&T希望吸引第三方开发这到它的AI平台引擎。目前只开放给AT&T的合作伙伴的AT&T的Watson API库,计划在2012年6月开放给第三方开发者。AT&T将首先开放语音到文字,通用和本地搜索,语音邮件和SMS的库,而多模式能力(结合语音和手势识别)将仍只提供给其战略合作伙伴。AT&T将它的智能网络视为不断发展的VA领域的核心竞争优势。由于版权许可交易商业化的潜力,AT&T实验室在AI领域的600个专利肯定给它带来竞争优势。