RAG与LLM原理及实践（9）--- word 段落与图片关联存储应用

PhoenixAI8

已于 2024-07-30 20:41:41 修改

阅读量128

点赞数 4

分类专栏： RAG Milvus Chroma 源码及实践文章标签： word milvus vector db 人工智能 python

于 2024-07-30 20:31:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/talentyiyy/article/details/140804181

版权

RAG Milvus Chroma 源码及实践专栏收录该内容

20 篇文章 2 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

目录

需要解决的问题

编码分析及相关逻辑处理

图片关联分析及处理

录入 vertor db

背景

最近AI领域发展非常迅猛，但就我个人而言，多智体AI Agent是我最看好的一个方向。RAG作为AI Agent 推理，回答，再推理，再回答的一个重要应用，在未来各行业必将得到广泛应用。最近有项目，要求将以前存储在word中形成的知识库录入到RAG中，作为本地垂直化应用查询的一个重要手段，对项目起着举足轻重的作用。一般来说，LLM 基本处理的是语言编码问题。但由于我们的知识库中还有大量图片等信息，所以如果只是存储文本，那显然是不够的。另一个问题是，我们希望通过图片的搜索，能够反过来得到与之相关的或者直接能帮助我们求解的所有相关图片及对应的经验操作。其实这是一个系统工程。这个项目的RAG输入有两类：一类是word，另一类是pdf。今天重点解决word形成知识库的录入。如果说只是提取文字，那这个实现优雅而简单，一次遍历打开 word，根据 docx的 paragraph 读取 text，用 encoding model 转为向量存储模型就能搭建完成，如果你不清楚怎么做，可以看看我前面的文章。但这次需要解决的是word 中文字与图片的关联处理。并且word 中的图片不能随意存储，因为你要与和他关联的问题及内容相匹配。实际上，对于图搜图的过程，你如果看了本专栏前面的文章，其做法应该不陌生，不清楚可以看:Milvus 实践(1) --- 文本-图片交互式s

了解本专栏

超级会员免费看

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RAG与LLM原理及实践（9）--- word 段落与图片关联存储应用

另一个问题是，我们希望通过图片的搜索，能够反过来得到与之相关的或者直接能帮助我们求解的所有相关图片及对应的经验操作。当然如果你采用的是第一种思路，那没有问题，可以完成图搜图的过程，他的原理我在之前文章讲过了，就是训练 CLIP 模型得出的，将文本与图片信息放在同维度并通过训练使得配对文本与图片的similarity小，不配对的similarity大。实际上你一额可以将图搜图的过程变相的理解为：图经过反CLIP，得到他的文本信息，再通过文本信息搜索相关图片，也是可以的。本项目为保守起见，我用的是第一种思路。
复制链接

扫一扫

专栏目录

PhoenixAI8 CSDN认证博客专家 CSDN认证企业博客

码龄16年

33: 原创

8505: 周排名

2万+: 总排名

3万+: 访问

: 等级

1099: 积分

624: 粉丝

714: 获赞

5: 评论

352: 收藏

私信

关注

热门文章

分类专栏

最新评论

Milvus核心组件（1）- Architecture
PhoenixAI8: 在 milvus.yaml 中： minio: address: localhost # Address of MinIO/S3 port: 9000 # Port of MinIO/S3 accessKeyID: minioadmin # accessKeyID of MinIO/S3 secretAccessKey: minioadmin # MinIO/S3 encryption string useSSL: false # Access to MinIO/S3 with SSL 有一段minio 配置。但是你会发现在 windos 上实际上 9000 并没有 listen，没有提供minio 服务。从 data 上来看，也是 etcd 接管了所有数据，不仅是 meta data。但 milvus 2.4 是需要 minio 的，从 yaml 中也看得到。只是2.2.6 版本在 windows 上做了处理。
Milvus核心组件（1）- Architecture
PhoenixAI8: 你直接在 windows 下只用 milvus 2.2.6 就是没有配置minio 的，python 直接 pip milvus 就可以导入。 from milvus import MilvusServer, MilvusServerConfig 就ok，你直接看他的配置文件，没有引入 minio。你只会看到 etcd.data，不会看到 minio
Milvus核心组件（1）- Architecture
çå»º: minio不是必须的，可以使用etcd，这个怎么实现，麻烦给出个配置示例
RAG与LLM原理及实践（2）--- RAG结合LLM function调用的原理及落地实践
PhoenixAI8: 算是，变相的一种本地RAG加强策略
RAG与LLM原理及实践（2）--- RAG结合LLM function调用的原理及落地实践
leonken88: 这不是function calling?

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。