智能聊天对话机器人的对比

陪聊机器人哪家强?小冰、小娜、小度,小i还是sir.

小冰、小娜Cortana、Siri、腾讯小鲸、出门问问、科大讯飞、度秘、QQ群qq机器人……哪家语音语义技术牛?

继小冰、小娜、Rinna、Tay、Zo之后,微软再推全新聊天机器人Ruuh

语音机器人:哪家强 度秘/小冰/Siri/小娜/小黄鸡横向评测!

天猫精灵方糖/小度智能音箱/小爱/小米音箱mini对比,你更爱哪款?_ZNDS资讯 https://news.znds.com/article/32798.html

(天猫精灵是阿里与国内IoT领域第一平台涂鸦智能达成了合作,小度是自家的,小米小爱是第三方合作的,华为音响是自家的

IBM深蓝、谷歌阿尔法狗、腾讯绝艺、搜狗汪仔、小度机器人和阿里大脑等等代表都是人工智能的典范

带着疑问,让我们进如神奇的人工智能智能聊天对话软件领域……

案例场景:图灵机器人or百度AI+讯飞语音+树莓派=语音聊天机器人

智能对话设备:百度智能音响/华为/小米/蓝精灵/天猫精灵/叮咚机器人

(代工廉价硬件+对话式人工智能操作系统+AI模型软件+云端数据中心(训练)+网络客户端 一般市场就流行这个解决方案)

网页/app/软件智能客服聊天:各家都有各自的智能客服聊天助手,AI接口+菜单+枚举式的服务

实体机器人、服务器机器人和工业机器人:开源的机器人操作系统和硬件派别很多,开源社区很多iRobot

国内市场:小帅智能机器人,阿尔法蛋机器人,麦吉机器人,未来小七机器人,智伴机器人,巴巴腾机器人等等

(在语音交互方面机器人都是差不多的。因为国内生产机器人的都不是自己研发语音系统的。所以很多品牌都是使用同类的语音交互系统。智能机器人就是两大系统,语音交互系统+数据爬取系统。 有上千的品牌和几百元品牌有时候使用起来功能都差不多。国内语音交互是科大讯飞做的最不错的。之前很多机器人都是使用他们的系统。 他们自己也生产的机器人就是阿尔法蛋机器人。 他们也把自己系统授权给很多品牌。 后面我估计很多品牌机器人为了抢占市场把价位拉的很低,阿尔法蛋机器人卖700多, 人家用它系统直接300多卖。 2017年中旬科大讯飞就停止对外授权语音交互系统了。 国内很多品牌机器人就转到国外语音交互系统NUANCE。 苹果手机SIRI语音就是由这家公司提供的。 开始我还担心这类语音识别是国外公司会不会反应比较慢。经过对比其实没多大变化。硬件:从乐高时代过渡到多种品类)

各家公司的应用

机器人的鼻祖:图灵机器人,目前所有的人工智能模型和语音识别的模型源自这。

谷歌机器人

微软小冰小娜

苹果Siri

百度语音[小度/度秘(基于dureos)]

讯飞语音(很多智能电视和车载语音助手用的这家)

微软小冰是微软推出的一款虚拟聊天机器人,有十几种生活服务技能,小黄鸡具有纯聊天功能。图灵机器人是一颗人工智能机器人大脑,虚拟机器人是图灵机器人的应用场景之一,个人开发者可使用图灵API快速创造属于自己的虚拟聊天机器人。除此之外图灵机器人具备超500种生活服务技能。

语音语义的现状可以大致描绘人工智能在工程界的应用情况。

有自主语音语义相关技术且可以在国内使用其服务的几家公司有:出门问问、科大讯飞、云知声、思必驰、百度(度秘)、腾讯(腾讯小鲸)以及Google(Google Now)、微软(小冰、小娜Cortana)、苹果(Siri)。

我们先来看看这四款机器人的一些简介。

语音机器人哪家强 度秘&小冰&Siri&小娜横向评测

和语音机器人聊天,总是会带来一些欢笑,四家智能机器人各有特色,而聊天时各种欢乐的小冰,则更能引起大家的兴趣。

现在智能语音机器人也越来越向多元化发展,就比如我们今天评测的四款智能语音机器人产品,四款智能机器人虽没有泾渭分明,但却各有千秋,我们具体从以下四个方面来看:

“吃”方面,Siri和小娜都能为你提供附近餐厅的信息,度秘则能够为你提供整套服务,比如提供自家的外卖服务等,可以说做的更加周到。

“行”方面,如果需要叫车的话,Siri、小娜都会提出“超出其能力范围”,而度秘则会直接提供两种专车服务,相对来说更人性化一些。不过需要指出的是Siri在你提出一个目的地后,会直接跳转苹果地图,并显示规划好的路线。

“玩”方面,在推荐电影时,度秘给笔者留下了很深刻的印象,不仅有最新的电影推荐,还有各种片种的推荐,顺带都有一些点评,十分不错。另一方面,让语音机器人唱个歌什么的,也挺有意思,而且小娜真的令笔者震惊了,逼真的人声唱出所点的歌曲,颇有一番风味。

“聊”方面,毫无疑问小冰贱贱的、更接地气的回答,会引起得大多数人的兴趣,小冰的回答有时也略显机(nei)智(han)。作为小冰的姊妹,小娜表现也并不差,但并没有小冰的回答更为有趣,其他两个就略显一般化。

                                                                   技术架构=语音系统和数据处理系统+硬件系统

总体来说,度秘连接到服务,Siri提供信息,小冰就是贱贱的卖萌,陪你聊天,而小娜则是提供信息和聊天兼有之。

【简介】

从1945年到2015年,以人工智能为题讲述了许多很美的故事,模仿游戏便是其实之一。但春冬轮回,在人工智能的世界里,人们的幻想像一个小球一样,被抛得高高,也注定摔得惨惨(1974与1987年两次人工智能寒冬)。

这一次,人们对人工智能的幻想被扔得更高了。强人工智能、机器毁灭人类的说法时常有。但这更像是预言家的说法,像阴谋论。目前的人工智能还是基于逻辑与数据、没有直觉,对情感的理解与创造力更是无从谈起。

球被抛得高就一定会落得惨,甚至摔得粉碎。不过,做工程的人更谨慎些,要给这个球栓上一根绳子。这根绳子就是“从实际应用出发、从用户角度考虑”。

语音语义的现状可以大致描绘人工智能在工程界的应用情况。有自主语音语义相关技术且可以在国内使用其服务的几家公司有:出门问问、科大讯飞、云知声、思必驰、百度(度秘)、腾讯(腾讯小鲸)以及Google(Google Now)、微软(小冰、小娜Cortana)、苹果(Siri)。

到底哪家的语音语义技术牛?

微软小冰属于聊天机器人,主打人机对话,每周例常解锁一种玩法。但微软小冰不能提供太多的实质性的服务,比如查询机票、查询车票、叫车,这些出门问问却能做到。

如何客观的评价技术的优劣?在这个信息交流特别频繁的时代,被使用的人工智能算法大都来自学术界的公开成果,很难有一家公司拥有不属于这个时代的技术。就从语音识别的角度上讲,各个公司的识别率大都在90%以上(这个问题实际上要复杂些,比如方言识别率、生僻词识别率等就有更多说法了)。当一家公司的技术只比另一家的好5%或者1%,用户便很难感受到优劣,技术被应用的场景便成了重要的不同之处。

人工智能语音语义系统的基本实现方法

这些公司的语音语义技术都和“云”离不开关系。人工智能系统按照一套逻辑推理程序,在海量的数据中寻找其认为最正确的答案。这就意味着,被使用的人工智能系统其覆盖的领域越广,就越是对数据以及运算能力饥渴。小型离线设备,如手机、家用电脑都无法满足这样的需求。解决办法是搭建一个拥有超强处理能力以及海量数据的“计算机集群”,并将其接入网络,也就是我们所说的“云”。搭建了AI语音语义系统的云就是AI语音语义云,是这些AI公司的基础设施。

搭建了智能云之后,还需要合适的语音输入端口。这个端口可以来自公众号、APP这类软件,也可以来自音箱、可穿戴智能手表这类硬件。

如何正确看待目前市面上知名的语音语义系统?

虽然人工智能系统的概念很广,具体到语音语义的概念还是很广,因此这么多类似但不同的人工智能公司在不同方向上深耕。从用户角度看,这些产品的不同之处还蛮大。

擅长搜索查询消息的个人助理的有腾讯小鲸和出门问问

1、腾讯小鲸目前公开的信息较少,主要被嵌入TOS系统。与Ticwear类似,TOS系统被搭载在智能手表当中。不过,小鲸的功能与其他语音助手类似,可以设置闹钟、查询信息,但不能像出门问问那样直接叫车、订咖啡。

有资料显示,曾在GoogleBrain工作过的工程师创立了名为ScaledInference的公司,该公司的种子轮投资者就包括腾讯首席探索官David Wallerstein和腾讯本身。另外,也有消息称,腾讯没有停止其他视觉识别产品的研发。

这有点像微信当年的研发。

2、出门问问主要做2C(面向消费者)硬件产品,其智能手表Ticwatch是国内销量较高的一款全交互智能手表。出门问问的人工智能语交互技术自成体系,包含语音识别、语音合成(TTS)、语义理解、垂直搜索、智能推送5个部分。其最大的特点是可以语音呼唤本地化生活服务,导航、看新闻、查天气等都可以通过手机APP或者手表实现。

最近,出门问问推出了内测版的“魔法小问”,要把人工智能从查询信息——如“今天有什么电影”——提升到提供完整服务,如直接帮助用户订电影票。这一点是其他智能系统做不到的。

擅长连续对话的“聊天机器人”有图灵机器人和度秘

3、图灵机器人主要做2B业务,其语音语义系统与小冰很相似,是连续对话机器人。图灵可以被嵌入微信公众号、APP、网站或者智能硬件,用户可以让它讲笑话、做游戏,也可以用它查快递、查新闻。最近图灵机器人接受了奥飞动漫的投资,走智能儿童玩具的路。

4、度秘是百度推出的一款与小冰类似的连续对话机器人。另外,用户可以在对话的同时,查询“图灵是谁”这样的信息——这借助了百度的搜索引擎。最近,百度推出嵌入了”度秘“的实体机器人”小度“。

还有一类人工智能系统即不是助理也不是聊天机器人,而是被用于做智能语音交互解决方案,他们有讯飞语音云、云知声的、思必驰

2017年百度和渡鸦合作推出了三款人工智能硬件产品——raven H、raven R和raven Q,其中raven H是渡鸦加入百度后推出的第一款智能硬件产品,也是DuerOS 对话式人工智能操作系统的标杆之作。(现在市场呼声不大)

5、科大讯飞的“讯飞语音云”包括语音合成、语音识别和搜索、语音听写等技术,该云对方言、生僻字的语音识别率较高。讯飞语音输入法就是基于此云开发的。科大讯飞“主要”做的是2B(面向企业用户)服务,将自己的人工智能服务授权给其他企业。

另外,科大讯飞在最近几年也开始发力2C(面向消费者)的产品,比如智能音箱、录音宝、录音笔等硬件。可以看到,科大讯飞的产品多是智能化的传统产品,而非个人助理或聊天机器人。另外,科大讯飞偏向深耕“语音识别”,而非连续对话。

6、云知声主要做2B业务,方向是智能家居和车载市场,这里便有了与出门问问类似的“软硬结合”的概念。

与“可穿戴设备、手机及电脑上的智能语音语义系统”不同,智能家居语音系统的声源可能很远且被噪音包围。也正因此,云知声把推广的重点放在了“声源识别、噪声抑制、回声消除”以及指令的识别上,而非对用户意图的理解上(语义理解)。

值得一提的是,在京东与科大讯飞宣布“在一起”的时候,阿里与云知声就达成了合作。不过,最近一段时间,未有相关消息。

7、思必驰与云知声的方向挺相似,为企业客户提供智能硬件语音交互方案,比如通过语音控制智能硬件的开关。思必驰在车载领域的合作多一些,比如车萝卜。最近,思必驰又宣布完成了融资,要把“智能语音融进硬件”这条路走得更远些。

8、小冰、小娜(Cortana)、Siri和Google Now

Cortana、Siri和Google Now,即是聊天机器人,也是个人助理。

微软小冰与微软小娜都基于必应搜索和深度神经网络等技术,属于2C产品。微软小娜如今可以在iOS、Android、Window 10系统中使用,她更像一个秘书,可以打电话、发短信、发邮件以及查询上一场曼联的比分。但是微软小娜在国内手机中的功能少很多,语音响应很慢。

微软小冰作为一个对话系统,入驻于微信、微博等应用或者Windows 10系统中,她也可以查询各种信息。与小娜不同,小冰不可以调用电话等应用,她更像一个虚拟人物,可以陪用户聊天(连续对话)、玩游戏(基于图像识别等人工智能技术)。

总的来看微软小娜和小冰代表着微软的两个方向:小冰连续对话能力强,可移植行强,因此可以嵌入到微信、微博、美拍等应用中。小娜是Window 10配套的人工智能系统,能够调用Windows 10中的各种应用和数据,被视为个人助理。

Siri大家熟悉,是一款可以调用应用的聊天机器人。如今的Siri除了定闹钟、发短信以外,还可搜索照片、播放音乐、提供建议。它或许不是最强大的,但更面向用户。

Google Now在国内无法良好的使用,对中文的识别效果很差,中文版的能力也很弱。但是作为Google的产品,它天生便有了比其他人工智能产品更多的数据、更好的数据挖掘能力,这使得Google Now成为了一款“主动推送”能力很强的助理产品。

Google Now凭借与Chrome浏览器、Gmail、Google日历等等Google应用以及Android系统的“近亲关系”,使得其可以实现很多其他产品做不到的功能。比如,语音解锁、任意界面“OK,Google”唤醒、主动推送你喜欢的和你需要的“即时帖”。有人曾称赞:

“早上醒来,我惊奇的发现Google Now居然直接告诉了我去兼职工作的路上所要花费的时间。但是我没有设置,而且那不是我真正工作的地方。”

可以看到,Google从用户的地理与实践信息中明白了他何时去何地兼职。但仍需强调,Google Now在国内的功能很少,而且实现一些即时功能,用户必须把个人数据交给Google。

作为巨头推出的产品,小娜、Siri和Google Now经常被媒体用来比较,但这种比较有些不太恰当。一方面,几款产品中,只有Siri的易用性在国内不错。另一方面,人工智能系统要明白用户的用意,必须获取数据——越多越好。因此,人工智能系统必须入驻更多的软件或者平台,获取更高的权限。小娜虽然入驻了Android与iOS,但她仍然是微软的产品,在Windows 10上才有更好的易用性。同样,Google Now与Siri分别是Android阵营与iOS阵营的产品,前者擅长挖掘数据、主动推送,后者擅长聊天、被动建议。

可以看到,这些语音方面的人工智能公司有业务2B或2C的,选择软硬结合或者只做软件解决方案,深耕智能家居或者智能穿戴。这些选择,无分对错或者好坏。但总体来看,人工智能仍然没有认知能力,人与人工智能聊天又涉及到感情投入——这是一个超出自然科学范畴的问题。用户对智能家居的认知度还不够高,相关产品不够成熟、定价不够亲民。这样看,搞智能家居系统这样的生态,似乎有点望得太远。

因此,人工智能在普通消费者身上的落地是否可以先在“一个点”上引爆,比如人工智能系统作为助理,从仅可查阅机票信息提升到可以提供订票服务。

【参考资料】

1、基于讯飞语音,百度语音,图灵机器人树莓派的智能语音机器人https://blog.csdn.net/u013372900/article/details/72785306

2、对话式机器人-百度AI-百度AI开放平台 http://ai.baidu.com/solution/robot

      DuerOS官方网站 https://dueros.baidu.com/ (物联网操作系统)

3、图灵机器人-中文语境下高智能度的机器人大脑 http://www.tuling123.com/

4、图灵AI开放平台-首页 http://biz.turingos.cn/home

5、小冰、小娜Cortana、Siri、腾讯小鲸、出门问问、科大讯飞、度秘……哪家语音语义技术牛?-虎嗅网 https://www.huxiu.com/article/137733/

6、图灵+百度语音 聊天机器人 移植小结 -  https://blog.csdn.net/xpp012/article/details/77665029

  • 8
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值