AI大模型向量Embeddings+向量数据库实现文搜文、图搜图

yuanlaile

已于 2025-04-03 14:26:34 修改

阅读量1.7k

点赞数 6

文章标签：人工智能向量Embeddings 向量数据库 AI大模型教程

于 2024-10-12 15:02:34 首次发布

本文链接：https://blog.csdn.net/yuanlaile/article/details/142877922

版权

文搜文、图搜图介绍:

IT营大地老师主讲AI大模型向量Embeddings+向量数据库实现文搜文、图搜图学习：

AI教程

文搜文 ：即文本搜索文本，是指通过输入关键词或短语，在大量文本数据中检索出与之相关的内容。搜 索引擎（百度、谷歌、 360 ）、 文档管理系统 、 电商搜索 。

图搜图 ：即图像搜索图像，是一种基于图像内容的搜索技术。 电商平台 、 版权保护 、 设计行业 、智 慧医疗 （医生可以通过图搜图技术检索医学影像库中的相似病例，辅助病情诊断和治疗方案的制定）、 旅游出行 。

传统的 Elasticsearch 全文搜索引擎可以通过分词实现搜索功能，但是要实现图搜图就无从下手了。

向量 Embeddings 结合向量数据库不仅可以实现文搜文，还实现图搜图。

向量 Embeddings 结合向量数据库在向量搜索领域相比 Elasticsearch 具有更高的性能（比如相似度）、更强的灵活性和可扩展性、更低的开发门槛和成本效益，以及更广泛的应用场景。

比如 Milvus 向量数据库，在 万亿条 向量数据中检索数据可以实现毫秒级别的速度。

向量 Embeddings 介绍：

向量 Embeddings 也叫向量嵌入（ Vector Embeddings ），是自然语言处理（ NLP ）和机器学习领域中一个非常重要的概念，它是一种将高维数据（如文本、图像、音频或视频等）映射到低维空间（向量）的技术。这种转换使得这些数据（如文本、图像、音频或视频等）能够在数学上被处理，从而能够进行自然语言搜索、分类、计算等操作。