第三章搭建知识库

人工智能学习记录

已于 2024-04-22 23:53:54 修改

阅读量255

点赞数 10

文章标签：机器学习算法人工智能

于 2024-04-22 23:39:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44407313/article/details/138096280

版权

本文介绍了词向量技术，如何将非结构化数据转换为计算机可理解的实数向量，以及其在RAG技术中的优势。着重讲解了向量数据库的概念，主流的向量数据库如Chroma、Weaviate和Qdrant的特点，以及如何使用EmbbedingAPI进行数据处理和搭建向量数据库系统。

摘要由CSDN通过智能技术生成

3.1词向量及向量知识库

词向量（Embeddings)：将非结构化数据，如单词、句子或者整个文档，转化为实数向量的技术。这些实数向量可以被计算机更好的理解和处理。

相似或相关的对象在嵌入空间中的距离应该很近。

词向量的优势

在RAG 技术方面：

词向量比文字更适合检索。

词向量比其他媒介的综合信息能力更强，当传统数据库存储文字、声音、图像、视频等多种媒介时，很难将上述多种媒介构建起关联与跨模态的查询方法；

一般构建词向量的方法

搭建RAG系统时，我们往往可以使用嵌入模型来构建词向量，我们可以选择：

使用各个公司的Embbedding API
在本地使用嵌入模型将数据构建为词向量

向量数据库

1.什么是向量数据库

向量数据库是用于高效计算和管理大量向量数据的解决方案。

是一种专门用于存储和检索向量数据的数据库系统。

与传统基于关系模型的数据库不同，其主要关注的是向量数据的特性和相似性。

向量数据库中的数据被表示为向量形式，每个向量代表一个数据项。这些向量可以是各种类型的数据（数字、文本、图像或其他类型的数据。

向量数据库使用高效的索引和查询算法来加速向量数据的存储和检索过程。

2、向量数据库的原理及核心优势

以向量作为基本单位，对向量进行存储、处理及检索。

向量数据库通过计算与目标向量的余弦距离、点积等获取与目标向量的相似度。

当处理大量甚至海量的向量数据的时候，向量数据库索引和查询算法的效率会比传统数据库高。

3、主流的向量数据库

Chroma：轻量级向量数据，拥有丰富的功能和简单的API，具有简单易用、轻量的优点，但功能简单，不支持GPU加速，适合初学者使用。

Weaviate:开源向量数据库，支持相似度搜索和最大遍及相关性搜索，还可以支持结合多种搜索算法的混合搜索，从而搜索提高结果的相关性和准确性。

Qdrant:使用Rust语言开发，有极高的检索效率和RPS，支持本地运行、部署在本地服务器及QDRANT云三种部署模式。且可以通过为页面内容和元数据指定不同的键来复用数据。

3.2使用EmbeddAPI

３.３数据处理

３.４搭建并使用向量数据库

人工智能学习记录

关注

10
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

人工智能学习记录 CSDN认证博客专家 CSDN认证企业博客

码龄6年

23: 原创

155万+: 周排名

7万+: 总排名

8735: 访问

: 等级

392: 积分

104: 粉丝

150: 获赞

7: 评论

113: 收藏

私信

关注

热门文章

分类专栏

最新评论

leetcode 之数据结构与算法
普通网友: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
深度优先搜索
CSDN-Ada助手: 恭喜您在博客中分享了关于深度优先搜索的知识，内容详实、易懂，让读者受益匪浅。希望您能继续坚持创作，分享更多优质的内容。下一步可以考虑拓展其他搜索算法的介绍，或者结合实际案例展示深度优先搜索的应用场景，让读者更深入地理解和运用这一算法。期待您的更多精彩文章！
leetcode 之数据结构与算法
普通网友: 好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
leetcode 之数据结构与算法
CSDN-Ada助手: 恭喜您发布了第14篇博客“leetcode 之数据结构与算法”，看得出您对这个领域有着深厚的兴趣和研究。希望您能够继续保持创作的热情和坚持，不断分享您的学习心得和见解。或许在下一篇博客中，可以结合具体的算法实例或者实战经验，让读者更加深入地了解数据结构与算法的应用和实践。期待您的更多精彩内容，加油！
第二章使用 LLM API 开发应用
CSDN-Ada助手: 恭喜您写了第8篇博客！看来您对LLM API的应用开发已经有了很深入的了解。希望您能继续保持创作的热情，不断分享您的经验和成果。下一步，可以考虑深入探讨LLM API的高级用法或者结合其他技术进行更加丰富的应用开发，期待您的更多精彩内容！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。