推荐系统(4)-基于内容的推荐系统(Python)

文章介绍了基于内容的推荐系统,主要应用于文本领域如新闻推荐。该系统通过构建商品画像,利用余弦相似度计算物品间的相似性,采用TF-IDF等方式处理文本特征。虽然推荐准确,但面对新用户冷启动问题,因缺乏用户历史行为数据,推荐变得困难。文中还提及了使用Word2Vec等技术处理文本特征,并提供了代码实例链接。
摘要由CSDN通过智能技术生成

1介绍

基于推荐系统(4)-基于内容的推荐系统的学习

基于内容推荐的方法特别适用于文本领域,比如新闻的推荐等等。
核心:首先构造商品画像,之后根据此画像来寻找最相似的其他商品。
基本思想:给用户推荐与其曾经喜爱的物品相似的物品(基于物品自身的属性,而ItemCF是指喜欢物品A的用户一般都喜欢物品B,那么可以给喜欢物品A但是还没有发生用户行为的其他人推荐物品B)

2基于内容推荐系统的算法原理

2.1相似度计算

那又如何计算相似度呢?
答:转换成了向量的形式,计算两个向量之间的相似度。最经典的评估方法就是使用余弦相似度。
例子:电影构造物品画像
在这里插入图片描述
问题:如何把这些特征表示成向量?
离散型变量——通过独热编码的形式来转换成向量
数值型变量——直接使用等等

问题:那文本类的特征如何处理呢? 比如电影的描述。
答:设计NLP领域。我们可以直接使用TF-IDF的方式即可以转换成向量的形式。当然我们也可以使用Word2Vec等技术来表示成向量的。

向量表示特征
例子:特征也叫作画像
在这里插入图片描述

2.2相似度排序推荐

2.3基于内容推荐算法的优缺点

优点:推荐较为准确

2.4如何去处理新用户的冷启动问题?

冷启动在推荐系统中非常常见。在基于内容的推荐算法中,一旦一个新用户来了,由于他还没有购买任何的物品,所以无法给他推荐任何物品的。

3代码实例

参考

推荐系统(4)-基于内容的推荐系统:https://zhuanlan.zhihu.com/p/98295397

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

weightOneMillion

感谢未来的亿万富翁捧个钱场~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值