基于物品的协同过滤算法

场景:猜你喜欢

数据量:大数据架构

检验:准确率、召回率、覆盖率、流行度

 步骤:

  • 构建物品的同现矩阵
  • 建立用户对物品的评分矩阵
  • 同现矩阵*评分结果=矩阵计算结果
选择结果列向量中最大的未评价的推荐

具体实现:Hadoop+Mahout(数据模型、相似度、近邻、推荐、评分)
测试数据集:
rating.csv
3列:用户ID,图书ID,评分数据
记录数:4000次评分
用户数:200个
图书数:10000个
评分:1-10

users.csv
3列:用户ID,用户性别,用户年龄
用户数:200个
用户性别:M,F
用户年龄:11-80岁


算法模型:
3种推荐算法 UserCF,ItemCF,SlopeOne
基于用户:
  • 相似度距离+最近邻+推荐(评分,无评分)
基于物品:
  • 相似度距离+推荐算法(评分,无评分)
评估:查准率+召回率(查全率)

系统架构:Mahout 单机+分布
开发环境:Win7 64 + Java + Maven3 + Eclipse + Mahout 0.8 + Hadoop1.2
结果:userEuclideanNoPref 性能最好

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值