RAG私域问答场景升级版方案(第二期方案)[2]:工业级别构建私域问答(业务问题、性能问题、安全成本问题等详细解决方案)
第一期方案参考:
1.第二期方案改进介绍
根据业界 DIFY、扣子、MaxKB等 AI 应用开发平台,LlamaIndex、LangChain 等 RAG 技术,确定将以下方面作为 RAG 模块的优化方向:
-
知识库(Repository)。
- 将原数据集概念更改为用户更易于理解的知识库概念。将文档与知识库的实体模型从 1 对多改造为 1 对 1 关系,降低用户使用知识库的门槛。
-
文档加载(DocumentLoad)。
- 支持本地文件、语雀知识库、钉钉文档、ODPS 表读取。对文档加载模块重构,支持多种上传方式、多种格式文档的快速扩展,并标准化文档加载的链路流程。
-
文档切分(DocumentNode