聊天机器人历史

定义

模仿人-人交互的模式来构建人机交互系统,我们称之为对话系统(Spoken Dialogue Systems, SDSs)(Lopez-Cozar &Araki, 2005; McTear, 2004; Pieraccini, 2012)或聊天机器人。

 

时间?叫什么?是什么?有什么用?怎么实现的?

 

1950年,图灵测试,起源

聊天机器人的研究源于图灵(Alan M. Turing)在1950年《Mind》上发表的文章《Computing Machinery and Intelligence》,文章开篇提出了“机器能思考吗?”(“Can machines think?”)的设问,并且通过让机器参与一个模仿游戏(Imitation Game)来验证“机器”能否“思考”,进而提出了经典的图灵测试(Turing Test)。图灵测试被认为是人工智能的终极目标,图灵本人因此也被称作“人工智能之父”。

论文链接:JSTOR: Mind, New Series, Vol. 59, No. 236 (Oct., 1950), pp. 433-460

p442图灵的原句是:
"I believe that in about fifty years' time it will be possible to programme computers, with a storage capacity of about 10^9, to make them play the imitation game so well that an average interrogator will not have more than 70% chance of making the right identification after five minutes of questioning."
图灵预言,到 2000 年在模仿游戏中普通人能区分人与机器人的概率将会低于 70%。亚马逊语音助手 Alexa 部门的首席科学家 Rohit Prasad 认为,随着 AI 被广泛整合到手机、汽车和家庭,人们现在关心的是人机之间的互动,而不是区分机器和人类。他认为图灵测试过时了,AI 需要新基准测试。Rohit Prasad 指出,最近几年的聊天机器人程序已经能欺骗三成以上的裁判相信它是人类,而愚弄 30% 的裁判这一阈值实际上是任意设定的,并无多大的意义。(Solidot)

 

1966年,ELIZA(伊莉莎),第一个实现了的聊天机器人,人工编写关键词匹配+回复

最早的聊天机器人ELIZA[1]诞生于1966年,由麻省理工学院(MIT)的约瑟夫·魏泽鲍姆(Joseph Weizenbaum)开发用于在临床治疗中模仿心理医生。值得注意的是尽管ELIZA的实现技术仅为关键词匹配及人工编写的回复规则,但魏泽鲍姆本人对ELIZA的表现感到吃惊,随后撰写了《Computer Power and Human Reason》这本书,表达他对人工智能的特殊情感。

请看“伊莉莎”在计算机上与一位姑娘的谈话摘要:

姑娘: 男人们全都一样。

伊莉莎: 在哪些方面?(拒识处理--提问1)

姑娘: 他们总找借口躲避我们

伊莉莎: 你能举个例子吗?(拒识处理--提问2)

姑娘: 好吧,我的男朋友要我到你这里来。

伊莉莎: 哦,你的男朋友要你到我这里来。(“关键词” 匹配)

姑娘: 他说我很烦闷。

伊莉莎: 你很烦闷,这使我很难过。(“关键词” 匹配)

 

1988年,UC(UNIX Consultant),

1988年,加州大学伯克利分校(UC Berkeley)的罗伯特·威林斯基(Robert Wilensky)等人开发了名为UC(UNIX Consultant)[2]的聊天机器人系统。顾名思义,UC是一款帮助用户学习怎样使用UNIX操作系统的聊天机器人。它具备了分析用户的语言、确定用户操作的目标、给出解决用户需求的规划、决定需要与用户沟通的内容、以英语生成最终的对话内容以及根据用户对UNIX系统的熟悉程度进行建模的功能。如果说ELIZA开启了智能聊天机器人时代的话,那么UC则进一步推动了聊天机器人的智能化程度。

1990年,设立勒布纳奖

为了将图灵测试付诸实践,美国科学家兼慈善家休·勒布纳(Hugh G. Loebner)于1990年设立了人工智能年度比赛——勒布纳奖(Loebner Prize)[3](包括10万美金的奖金和一块印有勒布纳与图灵头像的金牌)。勒布纳奖的设立旨在奖励首个与人类回复无差别的计算机程序,即聊天机器人系统,并以此推动图灵测试及人工智能的发展。

1995年,ALICE系统

在勒布纳奖的推动下,聊天机器人的研究迎来了一个高潮,这里面较为代表性的聊天机器人系统是ALICE(Artificial Linguistic Internet Computer Entity)[4]。受到ELIZA聊天机器人的启发,理查德·华勒斯(Richard S. Wallace)博士在1995年开发了ALICE系统。ALICE曾经在2000年、2001年和2004年三次问鼎勒布纳奖,并于1998年开始开源,目前全世界有超过500个开发者为ALICE项目贡献代码。值得注意的是,随着ALICE一同发布的AIML(Artificial Intelligence Markup Language)目前被广泛应用在移动端虚拟助手的开发中。尽管ALICE采用的是启发式模板匹配的对话策略,但是它仍然被认为是同类型聊天机器人中性能最好的系统之一。此外,还有用于查询英国电话黄页的YAP[5]、用于外语学习伴侣的CSIEC[6]、用于哈佛大学数学教学的Sofia[7]等,在这里暂不展开介绍。

 

2001年,SmarterChild,模式匹配和脚本答案

彼得·列维坦(Peter Levitan)创办了ActiveBuddy公司,其机器人SmarterChild用在老牌即时通讯AIM上,能对用户查询给出反馈。如问‘昨晚纽约扬基队的得分是多少?’可以得到快速的回答。在某种程度上,它是后世Siri等语音搜索工具的早期版本。

它在2006年被微软收购,并利用其技术推出了Windows Live Agents。

2006年?,IBM Watson,DeepQA

Watson是一个专家系统,能直接用自然语言回答专业问题,提供专家级别的决策咨询;

2011年的时候,在一个叫危险边缘的问答节目中首次击败了人类。

2014 年IBM 正式创建了 Watson业务部,开始了商业化之旅。

2015年,Watson独立出Watson Health部门,进军健康医疗领域。到2016 年,Watson 大约花费了40 亿美元(约新台币1200 亿元)收购了4 家医疗数据公司,包括Explorys、Phytel 和Merge Healthcare。

2018年,有报告称Watson推荐了“多个不安全和不正确治疗建议”。同年,IBM解雇了大批Watson工程师。

 

综合来看,AI医疗在今天更适合解决那些琐碎、重复度高的医疗工作,比如誊写病历、看X光片、检查化验单等等,这些工作可以把医生的时间解放出来。让AI本身去治疗重大疾病,无论是技术能力还是安全风险上都无法承担。

从底层技术上来说,Watson 从一开始到现在都是由 DeepQA 驱动。简而言之,DeepQA 是一套集分析、推理与提供答案的复杂软件架构,这套架构能够读取数百万文本数据,再通过自然语言处理技术产生答案,最后根据问题的情景作出回答。(“Building Watson: An Overview of the DeepQA Project”)

2011 年,Siri,

2008年,苹果发布App Store,整合了众多网络服务功能的Siri上架。后来,苹果收购Siri于2011,在iso 5搭载Siri。Siri能够支持广泛的用户命令,包括执行电话操作,检查基本信息,安排事件和提醒,处理设备设置,搜索互联网,浏览区域,查找娱乐信息,并能够与iOS集成的应用程序进行互动。

siri原理图:

 

2014年,微软小冰,

2014年5月29日下午,微软(亚洲)互联网工程院发布了人工智能机器人“微软小冰”。

2015年,阿里小蜜,

阿里巴巴集团在2015年7月24日发布一款人工智能购物助理虚拟机器人,并取名“阿里小蜜”。

架构

 

2015年,京东JIMI

2015年10月20日 金融页面正式接入JIMI,无需排队,24小时服务。

 

2017年,百度unit

百度面向开发者推出的智能对话定制与服务平台。

 

 

从应用场景的角度来看,可以分为在线客服、娱乐、教育、个人助理和智能问答五个种类。

在线客服聊天机器人系统的主要功能是同用户进行基本沟通并自动回复用户有关产品或服务的问题,以实现降低企业客服运营成本、提升用户体验的目的。其应用场景通常为网站首页和手机终端。代表性的商用系统有小I机器人、京东的JIMI客服机器人等。用户可以通过与JIMI聊天了解商品的具体信息以及反馈购物中存在的问题等。值得称赞的是,JIMI具备一定的拒识能力,即能够知道自己不能回答用户的哪些问题以及何时应该转向人工客服。

娱乐场景下聊天机器人系统的主要功能是同用户进行开放主题的对话,从而实现对用户的精神陪伴、情感慰藉和心理疏导等作用。其应用场景通常为社交媒体、儿童玩具等。代表性的系统如微软“小冰”、微信“小微”、“小黄鸡”、“爱情玩偶”等。其中微软“小冰”和微信“小微”除了能够与用户进行开放主题的聊天之外,还能提供特定主题的服务,如天气预报和生活常识等。

应用于教育场景下的聊天机器人系统根据教育的内容不同包括构建交互式的语言使用环境,帮助用户学习某种语言;在学习某项专业技能中,指导用户逐步深入地学习并掌握该技能;在用户的特定年龄阶段,帮助用户进行某种知识的辅助学习等。其应用场景通常为具备人机交互功能的学习、培训类软件以及智能玩具等。这里以科大讯飞公司的开心熊宝(具备移动终端应用软件和实体型玩具两种形态)智能玩具为例,“熊宝”可以通过语音对话的形式辅助儿童学习唐诗、宋词以及回答简单的常识性问题等。

个人助理类应用主要通过语音或文字与聊天机器人系统进行交互,实现个人事务的查询及代办功能,如天气查询、空气质量查询、定位、短信收发、日程提醒、智能搜索等,从而更便捷地辅助用户的日常事务处理。其应用场景通常为便携式移动终端设备。代表性的商业系统有Apple Siri、Google Now、微软Cortana、出门问问等。其中,Apple Siri的出现引领了移动终端个人事务助理应用的商业化发展潮流。Apple Siri随着IOS 5一同发布,具备聊天和指令执行功能,可以视为移动终端应用的总入口,然而受到语音识别能力、系统本身自然语言理解能力的不足以及用户使用语音和UI操作两种形式进行人机交互时的习惯差异等限制,Siri没能真正担负起个人事务助理的重任。

智能问答类的聊天机器人主要功能包括回答用户以自然语言形式提出的事实型问题和需要计算和逻辑推理型的问题,以达到直接满足用户的信息需求及辅助用户进行决策的目的。其应用场景通常作为问答服务整合到聊天机器人系统中。典型的智能问答系统除了IBM Watson之外,还有Wolfram Alpha和Magi,后两者都是基于结构化知识库的问答系统,且分别仅支持英文和中文的问答。

 

参考博客:

https://www.gkzhan.com/tech_news/detail/206772.html

参考文献:

[1] Weizenbaum J. ELIZA—a computer program for the study of natural language communication between man and machine[J]. Communications of the ACM, 1966, 9(1): 36-45.

[2] Wilensky R, Chin D N, Luria M, et al. The Berkeley UNIX consultant project[J]. Computational Linguistics, 1988, 14(4): 35-84.

[3] http://www.loebner.net/Prizef/loebner-prize.html

[4] http://www.alicebot.org/

[5] Kruschwitz, U., De Roeck, A., Scott, P., Steel, S., Turner, R., and Webb, N. (1999). Natural language access to yellow pages. In Third International conference on knowledge-based intelligent information engineering systems, pages 34–37.

[6] Jia J. CSIEC (Computer Simulator in Educational Communication): A virtual context-adaptive chatting partner for foreign language learners[C]//Advanced Learning Technologies, 2004. Proceedings. IEEE International Conference on. IEEE, 2004: 690-692.

[7] Knill O, Carlsson J, Chi A, et al. An artificial intelligence experiment in college math education[J]. http://www. math. harvard. edu/~ knill/preprints/sofia. pdf, 2004.

[8] Ginzburg J, Fernandez R. Computational Models of Dialogue[M]// The Handbook of Computational Linguistics and Natural Language Processing. Wiley‐Blackwell, 2010:429-481.

[9] Jurafsky, D., & Martin, J. H. (2009). Speech and language processing an introduction to natural language processing, computational linguistics, and speech recognition. Prentice-Hall, Inc. Second Edition.

[10] Reiter E, Dale R. Building natural language generation systems[M]. Cambridge University Press, 2000.

[11] Z. Ji, Z. Lu, H. Li. An information Retrieval Approach to Short-text Conversation. arXiv: 1408.6988, 2014.

[12] Ritter A, Cherry C, Dolan W B. Data-Driven Response Generation in Social Media.[J]. Empirical Methods in Natural Language Processing, 2011:583-593.

[13] L. Shang, Z. Lu, and H. Li. Neural Responding Machine for Short-text Conversation. In Proceedings of ACL, 2015. 

[14] I.V. Serban., A. Sordoni, Y. Bengio et al. Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models. arXiv:1507.04808v2 [cs.CL] 25 Nov 2015.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值