基于阿里云向量检索 Milvus 版与 PAI 搭建高效的检索增强生成（RAG）系统

最新推荐文章于 2025-05-06 15:00:00 发布

阿里云大数据AI技术

最新推荐文章于 2025-05-06 15:00:00 发布

阅读量1.1k

点赞数 10

文章标签：阿里云 milvus 人工智能

本文链接：https://blog.csdn.net/weixin_48534929/article/details/138665121

版权

阿里云向量检索 Milvus 版现已无缝集成于阿里云 PAI 平台，一站式赋能用户构建高性能的检索增强生成（RAG）系统。您可以利用 Milvus 作为向量数据的实时存储与检索核心，高效结合 PAI 和 LangChain 技术栈，实现从理论到实践的快速转化，搭建起功能强大的 RAG 解决方案。

免费试用

背景信息

随着 AI 技术的飞速发展，生成式人工智能在文本生成、图像生成等领域展现出了令人瞩目的成就。然而，在广泛应用大语言模型（LLM）的过程中，一些固有局限性逐渐显现：

领域知识局限：大语言模型通常基于大规模通用数据集训练而成，这意味着它们在处理专业垂直领域的具体应用时可能缺乏针对性和深度。
信息更新滞后：由于模型训练所依赖的数据集具有静态特性，大模型无法实时获取和学习最新的信息与知识进展。
模型误导性输出：受制于数据偏差、模型内在缺陷等因素，大语言模型有时会出现看似合理实则错误的输出，即所谓的“大模型幻觉”。

为克服这些挑战，并进一步强化大模型的功能性和准确性，检索增强生成技术 RAG（Retrieval-Augmented Generation）应运而生。这一技术通过整合外部知识库，能够显著减少大模型虚构的问题，并提升其获取及应用最新知识的能力，从而实现更个性化和精准化的 LLM 定制。

RAG 技术架构的核心为检索和生成。其中，检索部分采用了高效的向量检索引擎和向量数据库技术，例如基于开源库 Faiss、Annoy 以及 HNSW 算法优化构建的 Milvus 系统，极大地提升了对大规模数据进行快速检索和精确分析的能力。这样的设计使得RAG能够在必要时即时调用相关领域或最新信息，有效弥补了传统大语言模型的不足之处。

前提条件

已创建 Milvus 实例，并配置了公网访问。具体操作请参见快速创建Milvus实例和网络访问与安全设置。
已开通 PAI（EAS）并创建了默认工作空间。具体操作，请参见开通PAI并创建默认工作空间。

使用限制

Milvus 实例和 PAI（EAS）须在相同地域下。

操作流程

步骤一：通过 PAI 部署 RAG 系统

1.进入模型在线服务 EAS。

a.登录 PAI控制台。

b.在左上角顶部菜单栏选择目标地域。

c.在左侧导航栏选择模型部署>模型在线服务（EAS），在下拉框中选择目标工作空间后单击进入EAS。

2.在 PAI-EAS 模型在线服务页面，单击部署服务

3.在部署服务页面，选择大模型RAG对话系统。

4.在部署大模型RAG对话系统页面，配置以下关键参数，其余参数可使用默认配置，更多参数详情请参见大模型RAG对话系统。

参数		描述
基本信息	服务名称	您可以自定义。
基本信息	模型来源	使用默认的开源公共模型。
资源配置	模型类别	通常选择通义千问7B。例如，Qwen1.5-7b。
资源配置	资源配置选择	按需选择GPU资源配置。例如，ml.gu7i.c16m30.1-gu30。
向量检索库设置	版本类型	选择Milvus。
	数据库文件夹名称	您在Milvus中自定义的Collection名称。
	访问地址	Milvus实例的内网地址。您可以在Milvus实例的实例详情页面查看。
	代理端口	Milvus实例的Proxy Port。您可以在Milvus实例的实例详情页面查看。
	账号	配置为root。
	密码	配置为创建Milvus实例时，您自定义的root用户的密码。
	Collection删除	是否删除已存在的Collection。取值如下： True：删除同名的Collection，再创建新的Collection。如果不存在同名Collection，则直接进行创建。 False：保留现有的同名Collection，新加入的数据将追加到该Collection中。
专有网络配置	VPC	创建Milvus实例选择时的VPC、交换机和安全组。您可以在Milvus实例的实例详情页面查看。
	交换机
	安全组名称