心有灵犀一点通——从『灵犀语音助手』漫谈人工智能的未来

0 引子

最近看了一部有关人工智能与人类产生情感以及伦理讨论的电影《Her》,发现一个有趣的细节:


life

work

上面两张图是男主在家中和在工作是的场景,细心地你有没有发现:电脑前面的键盘和鼠标不见了!取而代之的是智能语音助手之类的人工智能工具。Incredible!畅想一下,当你坐在电脑前,只需要通过声音告诉电脑进行打字、搜索、购物、打印等等操作时,你是否会觉得双手从此被解放了?

乔布斯个人肯定是很不喜欢键盘的,要不怎么想把传统的手机键盘扔掉重新定义智能手机iphone?有人说,siri是个早产儿,乔帮主还没来得及将她做得完美就生了下来,我猜想,一向崇尚极简主义的乔帮主生前应该有这样一个夙愿:彻底丢弃那些烦人又占空间的家伙,以语音交互替代传统的键盘鼠标交互。

随着亚马逊首次推出智能音箱Echo,苹果紧随其后推出智能耳机airpods,这简直就是对电影的场景重现!


1 市场分析

人工智能到底离我们有多远?又会以怎样的形式改变我们的生活呢?

先让我们来看一组数据[1]:


市场规模

左上图显示中国人工智能市场规模的变化趋势,AI市场增长率保持高速增长,预计2018年市场规模将达到200亿;右上图为中国语音市场的市场规模变化情况,从2013年到2015年有所回落,2015年后增长率趋于稳定增长的态势。智能语音占据整个人工智能市场的比重也越来越大。

这并非偶然,智能语音技术的成熟使商业化应用成为可能。深度学习、高性能计算和大数据迅速发展,推动语音技术从实验室走向工业界,目前语音识别的准确率最高可到97%


语音识别的准确率

语音交互将成为人工智能的入口。国内外IT巨头纷纷入局,谷歌、苹果、微软、亚马逊、Facebook、三星、阿里、百度、腾讯、华为、科大讯飞等等,国内也陆续出现了思必驰、云知声、出门问问、声智科技、三角兽、蓦然、Rokid等创业公司,智能语音市场顿时火热。


AI产业链


2 产品选择

纵观国内智能语音助手市场,灵犀语音助手是普通话综合识别率最高的智能语音软件,也是国内市场占有率第一的中文语音助手[2]。灵犀语音助手由中文语音领导者科大讯飞和中国移动联合推出,特别针对中文口音问题进行识别优化,曾获得第67期豌豆荚设计奖。

截止到目前为止,灵犀语音助手在Android市场的下载量超过4.9亿[3],在IOS系统由于有siri的把持未能被广泛使用,苹果的封闭性也导致无法获取其下载量等数据。


灵犀语音助手安卓市场下载量


3 产品分析


灵犀语音助手

本人在两个系统上分别下载了Android-5.0.2910和IOS-5.0.1724版本进行体验,下面将从用户体验五要素的角度来分析『灵犀语音助手』这款产品。版本之间的差异很小,有明显不同的地方将特别指出。


3.1 战略层

灵犀语音助手的SWOT分析


SWOT分析

产品定义
“灵犀语音助手”是基于无处不在的网络和丰富的互联网内容,结合前沿的智能语音技术,为广大移动手机客户提供“所说即所得”的一站式智能语音服务。集通讯服务、出行指南、生活服务、音乐服务、上网服务与闲聊服务一体的应用软件。

产品目标:产品本身不收取任何费用,旨在吸引新用户,培养用户习惯,增加用户黏度;为其他生活服务如火车票、机票、美食、酒店、影院、听书提供接入口。语音助手不同于输入法等纯工具类的产品,是最具成长为入口潜力的产品。将其当成战略性产品发展,增长并保持用户,再诱导用户进入更有商业价值的入口,增强市场影响力,从而上升到坚不可摧的地位。

用户需求

  1. 快速便捷地使用手机;
  2. 获取最新资讯和信息;
  3. 获得生活和娱乐服务。

用户群体分析
截止2016年12月,我国网民规模达7.31亿,手机网民规模达6.95亿[4],网民对网络的需求和对于生活便捷的追求,使得目标受众广大,散布各行各业。
用户群体特征:

  1. 10~60岁,以18~38岁的青年、中年为主体;
  2. 用户职业的构成比例多层次化,涉及各行各业;
  3. 热爱尝试新鲜事物的人群。

3.2 范围层

产品主要功能:

  1. 基础的手机功能调用,如打电话、发短信、设置提醒、语音笔记、打开应用等;
  2. 个性化的互联网服务,如搜索、翻译、查天气、查话费、找餐馆、订车票、问路、打车、听电台、听书等;
  3. 人性化的聊天服务,支持人机简单互动聊天。

3.3 结构层


灵犀语音助手结构图

分析灵犀语音助手的结构图,给我的第一感觉是:全而不精。功能过于庞杂,让人眼花缭乱找不到重点,就像简单的功能堆砌,难免给人粗制滥造的感觉。

这很中国移动。


3.4 框架层
  • 主页的页面布局及信息设计


    主页

    • 听书页面布局及信息设计


      听书

    • 语音交互页面布局及信息设计


      这里写图片描述

    • 个人信息页面布局及信息设计


      个人信息


3.5 表现层

灵犀语音助手的logo是一个白色背景的蓝色语音图标,整个APP以深粉红为底色,鲜艳醒目。打开后主页和支付宝主页很相似,突出语音助手作为主要是工具的价值。下面一直滑动的广告给用户的视觉造成一定的冲击,分散注意力,体验不是很好,听书推荐怎么也放到主页了?建议放到听书栏,主页尽量简洁明了,常用功能放在中间位置。

听书模块我都想不吐槽了,给人的感觉就是网页直接嵌入APP中,导航颜色也不和谐,节目五花八门,没法找到重点,很难集中注意力。建议选取优质的节目好好运营,而不是一味堆砌,好的产品用来满足大部分人的品味而不是所有人的品味。

不要过度依赖没有互联网思维的电信运营商,需求至上,体验是关键。


4 总结与展望

语音是最简单、最自然的交互方式,也是人类沟通最基本的方式,我相信未来一定会取代键盘和鼠标,提升工作效率解放双手,成为人工智能的市场入口。但是,现在的语音交互实际上都是语音控制,这个阶段我们真的很难让计算机理解人类语言。在这个前提下,真正的多轮对话实际上很难做到,当前更多的是解决基于场景的搜索问题。

如果语音只是入口,那么人工智能的未来在哪里?在智能家居?在智能车载?在智能可穿戴?

期待今后与你一起探讨,见证这个伟大时代的到来。


数据来源:
[1] 易观:2017智能语音应用专题分析
[2] 灵犀语音助手-百度百科
[3] 蝉大师
[4] 2017年中国互联网络发展状况统计报告(全文)


→彩蛋←

AI相关影视作品:

超体
超验骇客
Her
机器人与弗兰克
黑客帝国
复仇者联盟2:奥创纪元
超能查派
人工智能
机器人大爷
史宾机器人
机械公敌
机器管家
机械姬
环太平洋
邪恶机器人
铁甲钢拳
机器人总动员
明日边缘
西部世界(美剧)
传世(美剧)
黑镜(英剧)
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

老A的AI实验室

给博主点一杯卡布奇诺

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值