《向量数据库指南》——什么是比较 Embedding？

最新推荐文章于 2025-03-07 15:53:01 发布

大禹智库

最新推荐文章于 2025-03-07 15:53:01 发布

阅读量655

点赞数

分类专栏：《向量数据库指南》文章标签：向量数据库 AI模型魔搭社区 Milvus ModaHub Zilliz Cloud MIlvus Cloud

大禹智库

本文链接：https://blog.csdn.net/qinglingye/article/details/131624713

版权

《向量数据库指南》专栏收录该内容

709 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

本文通过word2vec模型探讨如何比较非结构化数据的Embedding，展示语义相似和不相似的向量表示。通过Marlon Brando、国王与王后以及Apple的例子，解释了如何进行向量加减以揭示潜在的语义变化，并介绍了近邻搜索和距离度量的概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

比较 Embedding

示例 0：Marlon Brando

示例 1：国王与王后

示例 2：Apple，水果还是公司

欢迎回到向量数据库 101 系列教程。

之前的教程中，我们介绍了非结构化数据、向量数据库和 Milvus——全球最受欢迎的开源向量数据库。我们还简单介绍了 Embedding 的相关概念，它代表高维向量，可以用作非结构化数据的语义表示，彼此临近的 Embedding 代表语义上是相似的。

本教程中，我们将在这些知识的基础上，通过单词 Embedding 的例子，看看语义相似的非结构化数据是如何相邻的，而不相似的非结构化数据是如何相互“远离”的。这属于近邻搜索的高层次概述，是一个计算问题，涉及到根据统一的距离度量来寻找与查询向量最接近的向量。我们会讨论一些主流的近邻搜索方法（包括我最喜欢的 ANNOY），以及常用的距离度量。

我们开始吧。

比较 Embedding

我们来看下几个词的 Embedding 向量的示例。下面例子中，我们将使用 word2vec，它这是一个古老的模型，使用

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大禹智库 大禹智库——河南第一民间智库

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。