基于LLM的人工智能聊天机器人:全面综述

24年6月来自韩国庆熙大学的论文“A Complete Survey on LLM-based AI Chatbots”。

过去几十年,数据量激增,为数据密集型、基于学习的人工智能技术奠定了基础。对话智体(通常称为人工智能聊天机器人)严重依赖此类数据来训练大语言模型 (LLM) 并根据用户提示生成新内容(知识)。随着 OpenAI 的 ChatGPT 出现,基于 LLM 的聊天机器人为人工智能社区树立了新标准。本文全面介绍基于 LLM 的聊天机器人在各个领域的发展和部署。

首先总结基础聊天机器人的发展,接着总结LLM 的发展,然后概述目前正在使用的基于 LLM 聊天机器人和处于开发阶段的聊天机器人。将人工智能聊天机器人视为生成新知识的工具,探索它们在各个行业的多种应用。然后,讨论尚未解决的挑战,并考虑用于训练 LLM 的数据以及对生成知识的滥用如何导致几个问题。最后,探讨未来前景,提高其在众多应用中的效率和可靠性。

如图是综述的概览:

添加图片注释,不超过 140 字(可选)

如图中的Venn图说明了早期聊天机器人、LLM 的发展以及代表该技术前沿的基于 LLM 聊天机器人之间关系。

添加图片注释,不超过 140 字(可选)

下表是聊天机器人文献的摘要:

添加图片注释,不超过 140 字(可选)

聊天机器人起源于 1950 年的一个简单的想法:“机器能思考吗?”这个想法被称为图灵测试,由艾伦·图灵提出 [34][35]。在这个测试中,人类参与者与一个未见过的人进行文本对话,并试图预测该人是机器还是另一个人。这为聊天机器人奠定了基础。多年来,聊天机器人发生了很大的变化,如今,它们使用复杂、先进的计算机程序(称为大语言模型 (LLM))以更复杂的方式交互。

1960-1980年:早期基础。在此期间,出现了几个聊天机器人。最早的聊天机器人之一是 1966 年在MIT制造的 ELIZA。它模拟了罗杰斯心理治疗师,通过模式匹配进行关键字识别,但它不理解输入的含义 [36]。尽管功能尚不完善、知识库有限,但 ELIZA 因说服用户相信其与人类相似甚至建立情感纽带而受到关注,这后来也引发了一些道德考量 [37]。PARRY 是另一个早期聊天机器人,创建于 1972 年,旨在模拟患有偏执型精神分裂症的人 [38]。它甚至可以与 ELIZA 聊天,这被视为向前迈出的一步,因为它可以表现出更可控的结构和情绪反应 [39][40]。

1981-2009 年:进步和主流整合。在此期间,聊天机器人变得更加先进。1984 年,Racter 作为一个AI程序出现,它可以写英文散文并模仿聊天机器人般的对话行为 [41]。与此同时,另一个名为 Jabberwacky 的AI项目于 1988 年启动。它旨在以友好的方式模仿人类的随意对话 [42]。它在与人类的交互中不断进化,存储对话中的关键短语以增强其知识库,然后用动态扩展数据库中的上下文-觉察算法来选择相关的回复 [43][44]。20 世纪 90 年代,Creative Labs的 Dr. Sbaitso 带来了进一步的创新,这是一个为 MS-DOS 计算机设计的聊天机器人。它配备当时的几种声卡,提供一个以蓝色背景和白色文本为特色的简单交互界面。然而,它创新地利用早期的文本-转-语音技术,通过语音合成和声卡 [45]。随后,在 1995 年,美国科学家 Richard S. Wallace 博士创建A.L.I.C.E.(人工语言互联网计算机实体),也称为 Alicebot,或简称为 Alice。它利用大大扩展的知识库并使用人工智能标记语言(AIML)来建立聊天指南,为聊天机器人技术带来了新功能 [46]。ELIZA 是 Alice 开发的灵感来源。 Alice 一经亮相,就因其能力而获得了极大的赞赏,并在 21 世纪 3 次获得Loebner奖 [47]。然而,由于某些限制,它未能通过图灵测试 [48]。在此基础上,2001 年,ActiveBuddy 在 AIM 平台上推出了 SmarterChild,迎来了另一项重大进步。它是首批通过交互式通信帮助用户完成日常任务(如天气更新和查看股票价格)的聊天机器人之一 [49]。聊天机器人继续发展,2008 年,英国人工智能科学家 Rollo Carpenter 推出了 Cleverbot。它是 1988 年聊天机器人 Jabberwacky 的继任者。Cleverbot 独特的策略是从人类输入中学习,而不是依赖预先编程的响应,这使其比其他聊天机器人具有明显的优势。此外,在 2011 年 Techniche 节的正式图灵测试中,Cleverbot 表现出色,获得了 59.3% 的类人评分,考虑到人类参与者的得分略高 63.3%,这一结果值得注意 [50]。

2010-2016年:智能语音助手时代。2011 年,IBM 推出了 Watson,这是一款对话式人工智能,曾在 Jeopardy 智力竞赛节目中两次夺冠。Watson 取得成功后,在医疗保健行业得到了广泛应用 [51],[52]。随后,微软在 2014 年推出了 XiaoICE [53]。这款聊天机器人建立在情感计算框架上,可以处理智商和情商的查询。微软的同一团队还创建了另一个名为 Tay 的聊天机器人。Tay 于 2016 年首次亮相 Twitter。然而,Tay 推出后不久,就开始发布攻击性推文,迫使微软在发布后仅 16 小时内就将其关闭。在此期间,聊天机器人通过即时通讯应用程序和各种平台上的语音和搜索智体融入日常任务中,变得更加突出 [54][55]。 2010 年,苹果率先推出了 Siri,这是一款 iOS 应用程序,2011 年成为 iOS 系统的一部分。作为个人助理,Siri 可以通过语音命令执行一系列任务,例如拨打电话、设置提醒和收集信息 [56]。随后,谷歌在 2012 年推出 Google Now,将语音输入转化为搜索结果。微软随后于 2014 年推出了适用于 Windows 的 Cortana,利用 Bing 进行用户查询。同年,亚马逊发布了 Echo 扬声器和 Alexa。不久之后,在 2016 年,谷歌通过 Google Assistant 进一步推进了该领域,后来 Google Assistant 被集成到 Google Home 扬声器和 Pixel 智能手机中。虽然这些语音助手提供了快速的互联网连接响应,但它们存在与多语言支持、隐私和安全相关的几个问题 [57]。

如图提供了LLM之前所有聊天机器人的完整时间表。现在,尽管过去几十年取得了所有这些进步,但随着 LLM 的兴起,聊天机器人的新时代已于 2020 年拉开帷幕 [58],[59]。

添加图片注释,不超过 140 字(可选)

通过对大量预训练好的Transformer进行大量训练,LLM 使聊天机器人能够提供更详细、更细致的响应。下表是LLM的的开发时刻表:

添加图片注释,不超过 140 字(可选)

LLM让高级聊天机器人的开发成为可能。当今市场上有各种各样的聊天机器人,其中 ChatGPT 处于领先地位。如图是LLM聊天机器人的开发时间表:

添加图片注释,不超过 140 字(可选)

下表是聊天机器人的各种应用清单:

添加图片注释,不超过 140 字(可选)

随着基于 LLM 聊天机器人的发展,在不同领域遇到了许多挑战。下表根据知识或数据的观点对每个角度的挑战进行分类,提供了一个结构化的大纲。

添加图片注释,不超过 140 字(可选)

  • 19
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值