大数据推荐系统算法之基于内容个性化推荐

大数据推荐系统算法有很多种,今天小编和大家分享一下基本内容(Content-based)做个性化推荐的方法。
推荐系统算法之基于内容个性化推荐
基于内容推荐算法的原理很简单,就是通过分析物品的特征,计算新物品与用户历史喜欢物品的相似度,找最接近的topN个作为推荐的候选项。
 
基于内容推荐算法的一般处理步骤以下:
1.将物品的属性资料结构化
2.从物品属性中提取重要特征,可根据实际情况给特征加权。
3.取用户喜欢的历史数据作为训练集,建立出用户的兴趣模型
4.将物品的特征属性与用户兴趣模型计算相似度,用一个阀值来判断用户是否喜欢物品,如果是多个物品时可以按相似度的高到低来取topn作为推荐候选项
 
上面第1、2两个步骤相对简单,就是根据物品实际的特性取重要特征可以了,比如电子产品选品牌,性能相关的特征,衣服鞋之类的可能选材料相关的特征。
 
详细讲解一下第3、4步如果建立用户兴趣模型。举个例子:
item 有三个牲 A,B,C 取用户喜欢的历史数据100条作为训练集。
接下来计算这100条训练样本集中A,B,C三个特征的比例,假如结果是 A:0.45,B:0.25,C:0.3
现在有物品如下
       A    B   C
物品1  0    1   1
物品2  1    0   0
 
那么物品1与用户的兴趣相似度为 0*0.45+1*0.25+1*0.3=0.55
    物品2与用户的兴趣相似度为 1*0.45+0*0.25+0*0.3=0.45
结果很明显物品1更比物品2更适合推荐给用户

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值