一种叫做RAG的技术能阻止人工智能模型编造故事吗?

一种叫做RAG的技术能阻止人工智能模型编造故事吗?

在这里插入图片描述
自2022年底OpenAI的ChatGPT发布以来,我们已经经历了近一年半的生成式人工智能热潮。但是,尽管对公司股价产生了变革性影响,但由大型语言模型(LLM)驱动的生成式人工智能工具仍然存在重大缺陷,使它们无法像许多人希望的那样有用。检索增强生成(或RAG)旨在修复其中的一些缺陷。

也许法学硕士最突出的缺点是它们倾向于虚构(也称为“幻觉”),这是人工智能语言模型在被要求重现训练数据中不存在的知识时产生的一种统计空白填补现象。当训练数据可靠时,它们会生成听起来似乎合理的文本,这些文本可能会转向准确性,否则可能只是完全编造出来的。

依赖虚构的人工智能模型会让人和公司陷入麻烦。在2023年,有两个律师引用法律案例的例子,这些案例是由人工智能虚构的,而这些案例并不存在。我们已经报道了ChatGPT捏造并指控无辜的人做了可怕的事情的针对OpenAI的索赔。今年2月,加拿大航空公司(Air Canada)的客服聊天机器人发明了一项退款政策;今年3月,纽约市的一个聊天机器人被发现编造城市法规。

因此,如果生成式人工智能的目标是成为推动人类走向未来的技术,那么就需要有人在此过程中解决这些问题。这就是RAG的用武之地。它的支持者希望,这项技术将有助于将生成式人工智能技术转变为可靠的助手,在不需要人类反复检查或事后猜测答案的情况下,提高生产率。

本特利大学(Bentley University)数学副教授诺亚•吉安西拉库萨(Noah Giansiracusa)表示:“RAG是提高法学硕士表现的一种方式,本质上是将法学硕士过程与网络搜索或其他文档查找过程相结合”,以帮助法学硕士坚持事实。

让我们仔细看看它是如何工作的,以及它的局限性是什么。

提高人工智能准确性的框架

尽管RAG现在被视为一种帮助解决生成式人工智能问题的技术,但它实际上早于ChatGPT。研究人员在2020年的一篇学术论文中创造了这个词,该论文由Facebook AI研究(FAIR,现在的Meta AI研究)、伦敦大学学院和纽约大学的研究人员共同撰写。

正如我们所提到的,法学硕士与事实作斗争。早在2023年2月,谷歌进入生成式人工智能竞赛的巴德公司(Bard)就在首次公开演示詹姆斯·韦伯太空望远镜时犯了一个令人尴尬的错误。这个错误使母公司Alphabet的价值蒸发了大约1000亿美元。法学硕士根据他们的培训数据得出的回答在统计上是最可能的,他们不理解他们输出的任何东西,这意味着如果你对某个主题没有专业知识,他们可能会提供看似准确的错误信息。

法学硕士还缺乏最新的知识和识别知识差距的能力。Giansiracusa说:“当一个人试图回答一个问题时,他们可以依靠自己的记忆,在匆忙中想出一个答案,或者他们可以做一些像谷歌或阅读维基百科这样的事情,然后尝试从他们找到的东西中拼凑出一个答案——仍然通过他们对这件事的内部知识过滤信息。”

当然,法学硕士不是人类。他们的训练数据老化得很快,尤其是在对时间敏感的查询中。此外,法学硕士常常无法区分其知识的具体来源,因为所有的训练数据都混合在一起,形成一种汤。

从理论上讲,RAG应该会使保持AI模型更新更便宜、更容易。“RAG的美妙之处在于,当有新的信息可用时,无需重新训练模型,只需用更新的信息增强模型的外部知识库,”Peterson说。这减少了LLM的开发时间和成本,同时增强了模型的可扩展性。”

RAG是如何工作的?

默认情况下,LLM将从其训练数据中提取统计学上听起来可信的输出,并在此过程中插入一些随机性,以使输出看起来更像人类。RAG在流程中引入了一个新的信息检索组件来搜索外部数据。数据可以来自任意数量的来源,并具有多种格式。

正如van der Putten所说,“当用户有问题时,RAG首先在所有源中搜索与该查询相关的文本片段。然后根据搜索结果向生成式人工智能模型或服务发送提示,请求回答用户的问题。”

为了从外部数据中找到有助于回答用户查询的相关信息,LLM将查询转换为矢量表示,这允许文本信息的密集数字表示,然后将其与它所持有的外部数据的矢量数据库进行交叉检查。例如,要求法学硕士识别有关苹果公司业务表现的信息,可能会导致法学硕士在外部数据中搜索所有提到苹果的信息,以及更广泛提及的企业信息,并根据信息的有用程度排名将这些信息呈现给用户。

RAG的强大之处在于,它可以用从外部数据中找到的新信息增强用户提示。它将试图利用这些信息来产生更好的提示,更有可能引发更高质量的回应。它可以被设置为不断更新外部数据,同时不改变位于流程背后的底层模型。

更棒的是,LLM生成的每个答案都可以输入到RAG期间使用的外部数据中,理论上有助于提高准确性。使用RAG的法学硕士还可能回忆起它是如何回答以前类似问题的。

至关重要的是,使用RAG的人工智能模型通常可以引用其声明的来源,因为它们的信息保存在矢量数据库中。如果LLM产生了一个不正确的答案,并且它被识别出来,则可以在向量数据库中确定该不正确信息的来源,并将其删除或更正。

RAG的潜在应用

除了RAG被认为为生成人工智能输出提供的一般好处之外,通过使用RAG来增加法学硕士在某些学科中所借鉴的“知识”,可以提高医学或历史等学科的专业知识。科技公司RWS Group的TrainAI高级主管Melanie Peterson说:“当你将RAG与特定领域的微调结合起来时,结果是一个更强大、更可靠、更精细的法学硕士,适合商业目的。”

一些人工智能专家表示,RAG已经在现实世界的应用中发挥了作用。范德普顿说:“在我的商业角色中,我们和我们的客户正在为许多目的探索rag,因为它如何引导人工智能朝着正确的方向发展。”“这些控制将使生成式人工智能在商业和其他领域得到更广泛的应用。”

但是,一只脚踏商界,一只脚踏学术界的范德普顿认为,RAG的好处超出了商界。“在我的学术研究中,我们也在研究有趣的社会应用,”他说。“例如,我们正在为像荷兰这样的基于比例代表制的选举系统开发一个由rag控制的投票助手。”

这个系统的运作方式是,让选民就自己提出的议题探讨不同党派的观点。他说:“我们的目标是减少两极分化,使选举选择更多地基于明确的政策和实际的提案、动议以及政党在议会中的投票行为。”

目前,OpenAI的ChatGPT在执行与用户问题相关的网络搜索时做了一种形式的RAG,提供更多的最新信息和用户可以验证的来源链接。谷歌的双子座人工智能模型也做同样的事情。OpenAI的gpt可以配置为使用来自外部数据源的信息,这也是RAG的一种形式。

它真的能解决虚构问题吗?

最近在意大利佩鲁贾举行的国际新闻节(International Journalism Festival)上,许多小组成员都有意提到RAG,认为它可以解决生成式AI的虚构问题。RAG似乎可以解决AI的所有问题。但这真的会发生吗?

应用数据科学合作伙伴(Applied Data Science Partners)的创始合伙人、《生成深度学习:教机器如何绘画、写作、作曲和玩耍》一书的作者大卫·福斯特(David Foster)说,在解决生成式人工智能的虚构问题时,“RAG是解决方案的一部分。”

但福斯特很清楚,这并不是一个包罗万象的解决方案来解决法学硕士的问题。他说:“这不是一个直接的解决方案,因为法学硕士在回应源材料时仍然会产生幻觉。”

为了解释为什么RAG不是一个完美的解决方案,福斯特打了一个比方。他说:“假设一名学生参加了英语文学考试,但在考试中无法获得原文。”“他们也许能写出一篇不错的文章,但他们很有可能会记错引文或记错事件的顺序。”

RAG就像是为学生提供了方便地访问原始材料来唤醒他们的记忆。(当然,将人工智能工具拟人化是有问题的,但在类比时很难避免。)

福斯特说:“如果你给学生原始文本,他们就能‘查找’相关信息,从而减少回忆中的错误。”“这是RAG。然而,学生仍然可能从书中错误的地方获取信息——因此仍然会得出错误的幻觉结论——或者他们可能会产生幻觉,产生不存在的额外信息。”

向前迈进了一步,但不是灵丹妙药

最重要的问题是,是否值得花费时间、精力和金钱将RAG集成到生成式人工智能部署中。宾利大学的Giansiracusa并不确定。他说:“法学硕士仍然在猜测答案,但有了RAG,猜测往往会得到改进,因为它被告知在哪里寻找答案。”这个问题和所有法学硕士一样:“对词汇和世界仍然没有深刻的理解,”他说。

Giansiracusa还指出,生成式人工智能辅助搜索结果的兴起——以及最近通过人工智能生成的内容对网络的“启蒙”——意味着,如果人工智能语言模型从网上找到的人工智能编写的垃圾中提取信息,那么在某种程度上,生成式人工智能工具的一个基本缺陷可能会变得不那么有用。

最近在谷歌的AI Overview中就看到了这个问题,它利用游戏页面排名来确定“准确”的来源,然后谷歌的AI模型将从中得出答案。

Giansiracusa说:“我们知道网络搜索充斥着错误信息,我们知道法学硕士充斥着幻觉,所以你可以在这里计算一下,当你把两者结合起来会发生什么。”

  • 14
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值