CB、CF

一、CB算法

(Content-based Recommendations)基于内容的推荐。

1.引入item属性

根据物品的属性进行推荐

a.搜索:“笔记本电脑”,

b.拆分(如jieba):笔记本+电脑

c.推荐:笔记作业本 台式电脑

2.引入user属性

引入了用户行为(基于历史行为)

a.用户第一天浏览了猫咪,第二天浏览猫抓板,第三天浏览猫粮

b.分析用户的浏览行为——用户养猫了

c.推荐——猫砂

如果是itme属性,当用户第三天浏览时,就会推荐A牌猫粮,B牌猫粮

3.计算

3.0数据准备

itemidname
101苹果笔记本电脑
102新冠性病毒

3.1将name进行分词

以jieba分词为例,将一句话分解成单个词语及权重

tokenitemidscore
苹果1014.759
笔记本电脑1013.767
新冠性1025.977
病毒1023.709

4.优缺点

itemuser
优点1.提升推荐结果的相关性2.结果可解释3.推荐结果容易被用户感知1.用户模型刻画用户需求2.推荐形式具有个性化3.结果可解释
缺点1.无个性化2.依赖于对item的深度分析1.推荐精度低2.马太效应3.覆盖率低(行为稀疏)

二、CF算法

(Collaborative Filtering Recommendations)协同过滤

1.User based

基于用户的协同过滤(User based Collaborative Filtering)

2.Item based

基于物品的协同过滤(Item based Collaborative Filtering)

3.计算

用户id userid物品id itemid评分 score
11015
11023
21014
21022

3.1归一化UI矩阵

将原来的得分进行归一化操作,重新输出userid, itemid, score_new

a.获取到同一个itemid的所有score,求平方和

itemidscorescore平方和
1015,45^2 + 4^2=41
1023,23^2 + 2^2=13

b.将各分数进行归一化

用户id userid物品id itemid新评分 score_new(四舍五入)
11015/√41=0.78
11023/√13=0.83
21014/√41=0.62
21022/√13=0.55

3.2相似度计算

a.匹配相似度,基于各用户对各物品打分

useriditemid_itemid匹配相似度
1101_1020.78*0.83=0.6474
1102_1010.83*0.78=0.6474
2101_1020.62*0.55=0.341
2102_1010.55*0.62=0.341

b.计算相似度

将所有itemA_itemB的分数相加

itemid_itemid匹配相似度
101_1020.6474+0.341=0.9884
102_1010.6474+0.341=0.9884

CB、CF区别

CB会进行关键字的提取,item会根据内容进行推荐

CF基于用户浏览行为

CBCF
数据源提取关键字基于浏览行为
计算内容属性计算相似度分析用户行为计算相似度
例子之前买过《高等数学1》,可能推荐《高等数学2》之前浏览过金鱼,可能推荐乌龟

相似度计算

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值