【快手面试】Word2vect生成的向量，为什么可以计算相似度，相似度有什么意义？

凝眸伏笔

于 2022-08-02 22:51:06 发布

阅读量647

点赞数 1

分类专栏： nlp 文章标签：面试 word2vec 职场和发展

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pearl8899/article/details/126131676

版权

Word2Vec 推荐算法相似度计算词向量上下文相似性

关键词由CSDN通过智能技术生成

nlp 专栏收录该内容

24 篇文章

订阅专栏

博客探讨了在推荐算法中如何使用Word2Vec生成item的向量，并通过计算相似度作为特征。Word2Vec利用词的上下文相似性学习到的向量，词向量的接近程度反映了词的相似性。当向量相加或相减时，夹角变化影响相似度，这在推荐系统中具有实际应用价值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景：

我是推荐算法方向的面试，在面试的时候，使用word2vector的方法生成item的向量，来计算行为序列中的item跟待预估的item的相似度，来作为一维特征。

二面面试官问题：

Word2vect生成的向量，为什么可以计算相似度，相似度有什么意义？

答案分析：

term在相同的前后文中，认为两个term是等价的，它们学到的向量也更接近，所以item的向量计算相似度，表示两个向量的相似程度，也即是是否等价。

原理分析：

什么词算相似，一般可以认为，如果两个词的上下文越相似，这两个词也就越相似。比如牛在吃草，马在吃草，牛和马后面的词都一样。又或者是我家在北京，我家在上海，北京和上海的功能差不多，这两个词也就越相似，个人认为这也就是word2vec的出发点。

word2vec得出的词向量其实就是训练后的一个神经网络的隐层的权重矩阵，在经过CBOW或者Skip-Gram模型的训练之后，词义相近的词语就会获得更为接近的权重，因此可以用向量的距离来衡量词的相似度。

向量相似性，一般地，我们以向量的夹角来评价两个向量的相似性

这样我们就可以发现，如果有两向量u,v，

当u加上s*v时(s是正标量)，u和v的夹角变小，因此更相似，

当u减去s*v时(s是正标量)，u跟v的夹角变大，因此相似性减弱

参考：
语言模型1-word2vec为什么能训练出相似向量_PeaceInMind的博客-CSDN博客

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。