推荐系统之基于word2Vec的推荐案例

最新推荐文章于 2024-04-17 12:25:11 发布

jialun0116

最新推荐文章于 2024-04-17 12:25:11 发布

阅读量1.7k

点赞数

分类专栏：实验推荐系统文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30031221/article/details/107915985

版权

实验同时被 2 个专栏收录

21 篇文章 0 订阅

订阅专栏

16 篇文章 2 订阅

订阅专栏

基于ml-latest-small的基于TF-IDF的特征提取

- 词向量

词向量

用向量来表示词语可以表示语义层面的含义
如果用word2vec模型创建的词向量，两个词向量相似度比较高，说明这两个词是近义词
词向量作用把含义相近的判断转换成向量的相似度计算
使用gensim Word2Vec模块训练词向量模型
- sentences = list(movie_profile[‘profile’].values) #准备所有用来训练词向量模型的文本
- model = gensim.models.Word2Vec(sentences,window=3,min_count = 1,iter = 20) #参数1 文本参数2 window 观察上下文关系的窗口长度 min_count 训练模型时要保留下的词语出现的频率 iter 迭代次数
通过词向量模型找到topn相似词
- model.wv.most_similar(positive=[‘要找到相似词的词语’],topn = 10)
文档向量
- from gensim.models.doc2vec import Doc2Vec,TaggedDocument
- documents = [TaggedDocument(words,[movie_id]) for movie_id,words in movie_profile[‘profile’].iteritems()] #训练模型并保存通过向量来表示一篇文档一篇文档对应一个电影向量的相似度代表电影的相似度
- model = Doc2Vec(documents,vector_size=100,window=3,min_count=1,workers=4,epochs=20)
- words = movie_profile[‘profile’].loc[6]
- inferred_vector = model.infer_vector(words) #传入电影的标签找到电影文档所对应的向量
- model.docvecs.most_similar([inferred_vector],topn=10) #找到最相似的n个向量

数据来源：
https://grouplens.org/datasets/movielens/
源码详见：
https://gitee.com/chenjialun16/recommendation_system

在这里插入图片描述

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
推荐系统之基于word2Vec的推荐案例

基于ml-latest-small的基于TF-IDF的特征提取词向量词向量用向量来表示词语可以表示语义层面的含义如果用word2vec模型创建的词向量，两个词向量相似度比较高，说明这两个词是近义词词向量作用把含义相近的判断转换成向量的相似度计算使用gensim Word2Vec模块训练词向量模型sentences = list(movie_profile[‘profile’].values) #准备所有用来训练词向量模型的文本model = gensim.models.Word2Vec(s
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。