人工智能的未来？RAG 结合了语言和搜索

本文链接：https://blog.csdn.net/2401_84587944/article/details/138336337

在这里插入图片描述

随着专家们暗示大型语言模型（LLM）的技术极限即将到来，人们的焦点转向了检索增强生成（RAG）——这是一项很有前途的进步，可以通过将信息检索与自然语言生成相结合来重新定义人工智能（AI）。

LLM引领了人工智能技术，并改进了各种应用。然而，他们产生虚假信息的倾向限制了他们的潜力。RAG 允许 AI 访问特定的外部数据并将其纳入其响应中，使其更加有效和准确。

“RAG相对于LLM的主要优势在于，前者完全基于所述RAG的所有者可以控制的专有数据集，从而允许更有针对性的应用程序，”人工智能公司Wonderslide的首席执行官Renat Abyasov告诉PYMNTS。“假设医生想为他们的病人部署一个聊天机器人;使用 RAG 将使他们能够确保所述聊天机器人提供的建议是可靠和一致的。LLM很难实现这种可靠性，LLM是用大量公开可用且有时相当可疑的数据进行训练的系统。

RAGs致富？
RAG 模型是将语言理解与实时信息检索相结合的尖端 AI。这使他们能够通过访问来自外部来源的最新相关数据来提供更准确和最新的答案。RAG 模型在新闻、研究和客户支持等动态领域表现出色，它们整合新鲜信息的能力使其在需要保持最新状态的情况下具有高度的适应性和价值。

在某些情况下，RAG 可能会击败 LLM。 Tonic.ai 是一家以其专有基准测试平台 Tonic Validate 而闻名的公司，最近对 RAG 系统进行了一系列评估。在其中一项测试中，焦点集中在 CustomGPT.ai 上，这是一种无代码工具，使企业能够将 ChatGPT 风格的解决方案与 RAG 数据库一起部署。

为了评估 CustomGPT.ai 的性能，Tonic.ai 将其与 OpenAI 的内置 RAG 功能进行了比较。评估数据集包括保罗·格雷厄姆（Paul Graham）撰写的数百篇文章和一组55个基准问题，这些问题的答案来自文本。主要目标是评估平台生成准确且与上下文相关的响应的能力。

测试结果显示，CustomGPT.ai 和 OpenAI 的工具都可以产生高质量的答案。然而，CustomGPT.ai 始终如一地为复杂查询提供更精确的响应，从而优于竞争对手。这一结果凸显了 CustomGPT.ai 部署生成式 AI 聊天机器人的简化方法的有效性，使其成为寻求在没有广泛编程知识的情况下实施此类解决方案的企业的一个有吸引力的选择。

使用 RAG 可以带来现实世界的好处。斯坦福大学研究人员和合作者最近发表在NEJM AI杂志上的一份报告表明，RAG可以显着提高LLM在回答医学问题方面的表现。

研究发现，在回答董事会认证医生编写的问题时，GPT-4 的 RAG 增强版本和其他程序的表现优于标准 LLM。作者认为，RAG对于在临床环境中安全使用生成式AI至关重要。

即使是医学特定的LLM，如Google DeepMind的MedPaLM，仍然在与幻觉作斗争，可能无法准确处理临床相关任务。

在相关新闻中，MedPerf 是一项新举措，旨在加快医疗 AI 的发展，同时保护数据隐私。这凸显了对安全可靠的数据集成方法（如 RAG）的需求日益增长，以确保医疗保健中人工智能生成的响应的准确性和相关性。

RAG的优势
Trustible的首席技术官Andrew Gamino-Cheong告诉PYMNTS，许多LLM都接受过相当通用的信息培训，这些信息可以很容易地从互联网上收集。他强调，RAG是增强LLM的一种强大且具有成本效益的方法。通过整合机密或最新信息，RAG 使 LLM 能够提供更准确和相关的响应。这种方法使企业能够充分利用 LLM 的潜力，同时保持其专有数据的安全性和特异性。

他补充说：“LLM的许多用例都受到可能较旧的数据的限制，而RAG模式是使它们保持最新状态的最有效方法，而无需花费数百万美元对其进行全面再训练。“一个秘密是，许多 LLM 提供商希望用户添加 RAG 管道或直接微调他们的基础模型，因为这从根本上转移了很多产品责任。”

Abyasov 解释说，RAG 模型最常用于创建自操作的技术援助程序和对话式 AI 界面。

“在LLM出现在公众的雷达上之前，RAG已经用于这个应用程序多年了，”他补充道。“总的来说，几乎任何需要你拥有严格控制的数据集的应用程序都会倾向于使用RAG，因为它们可以减少意外，并全面获得更一致的结果。”

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述