Machine Learning_实例2_Recommender System

本文将从以下两方面简单介绍本次任务的完成情况:
1. 实现算法简单介绍
2. 程序运行说明

一、 实现算法简单介绍

本次推荐系统采用基于用户的协同滤波推荐,来自参考文献[1]。
user a对item j的评分预测可以通过下列公式得到:
这里写图片描述

其中,va为user a所有评分的平均值,vij为user i对item j的评分,vi为user i所有评分的平均值,
w(a,i)为user a和user i之间的相关系数:
这里写图片描述

k为归一化因子,前k大相关系数之和:
这里写图片描述
k为所取的邻居数,根据参考文献[2]中figure6发现一味地增加邻居数,预测效果会下降,故本次任务中取10。

注:
关于cold start的处理:对于在对user a对应的item进行评分时,若新出现的item,则将其置为user a评分的平均值。

参考文献:
[1] J. Breese, D.. Heckerman, and C. Kadie, Empirical analysis of predictive algorithms for collaborative filtering, Proc. Conf. Uncertainty in Artificial Intelligence, (UAI98) 1998
[2] J.L. Herlocker, J.A. Konstan, J.R.A. Borchers, and J. Riedl, An algorithmic framework for performing collaborative filtering, Proc. International on ACM SIGIR Research and Development in Information Retrieval, (SIGIR98) 1998

二、 程序运行说明

本次任务代码运用python编写。
Python版本:Python 2.7.13

train_all_txt.txt:为训练数据;
allUserItem.txt:是由getTestFile.py得到的所有user对应所有item的评分文件,每个评分初始化为0;
userCF.py:主程序,用于实现基于用户的协同滤波算法,实现评分预测,运行本程序后会得到最终预测文件prediction_baseOnUserCF.txt,运行一次约6mins;
similarity_baseOnUser.txt:是由主程序输出的用户之间相关系数矩阵文件;
prediction_baseOnUserCF.txt:是由主程序输出的最终预测评分文件。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值