推荐系统测评

校招结束休息了快2个多月了,现在开始系统的学习推荐算法,基于项亮的书

一:推荐系统中主要有3种评测推荐结果的实验方法:

**1:离线实验
2:用户调查
3:在线实验**

离线实验的方法:
(1):通过日志系统获得用户行为数据
(2):将数据集分成训练集和测试集
(3):在训练集上训练模型,在测试集上进行测试
(4):通过事先定义的离线指标评测算法在测试集上的预测结果

用户调查:
顾名思义,但是招募测试用户的代价较大,很难组织大规模的测试用户

在线实验:
在完成离线实验和必要的用户调查后,可以将推荐系统上线做AB测试,将它和旧的算法进行比较

二:评测指标

1.预测准确度

预测准确度考虑推荐算法的预测打分与用户实际打分的相似程度。

平均绝对误差指标MAE(Mean Absolute Error):

平均平方误差MSE:


有一个电影评价系统,它可以对某一部电影给出其他用户评价电影的“星”的平均数(就好像豆瓣书评一样),而且给出对某个用户的预测“星数”。而预测准确度就是能够度量系统中预测“星”数与用户实际给出的“星”数的差别。打分区间为[0,10]

1.jpg

平均绝对误差MAE:
image
平均平方误差MSE:
image
标准平均绝对误差(做标准化):
image

 
预测准确度

预测准确度
优点
缺点

准确率(Precision),召回率(Recall),覆盖率(coverage)

为了评估推荐算法的好坏需要各方面的评估指标。

        对用户u推荐N个物品(记为R(u)),令用户u在测试集上喜欢的物品集合为T(u)
准确率就是最终的推荐列表中有多少是推荐对了的。描述最终的推荐列表中有多少比例是发生过的用户-物品评分记录。

召回率就是推荐对了的占全集的多少。描述有多少比例的用户-物品评分记录包含在最终的推荐列表中。

下图直观地描述了准确率和召回率的含义

覆盖率表示推荐的物品占了物品全集空间的多大比例。
最简单的覆盖率的定义如下:

新颖度新颖度是为了推荐长尾区间的物品。用推荐列表中物品的平均流行度度量推荐结果的新颖度。如果推荐出的物品都很热门,说明推荐的新颖度较低,否则说明推荐结果比较新颖。

这篇文章可以参考看一下,比我总结的清晰
http://blog.csdn.net/wangyuquanliuli/article/details/36684817

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
如今大数据已经成了各大互联网公司工作的重点方向,而推荐系统可以说就是大数据最好的落地应用之一,已经为企业带来了可观的用户流量和销售额。特别是对于电商,好的推荐系统可以大大提升电商企业的销售业绩。国内外的知名电商,如亚马逊、淘宝、京东等公司,都在推荐系统领域投入了大量研发力量,也在大量招收相关的专业人才。打造的电商推荐系统项目,就是以经过修改的中文亚马逊电商数据集作为依托,并以某电商网站真实的业务架构作为基础来实现的,其中包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。具体实现的模块主要有:基于统计的离线推荐、基于隐语义模型的离线推荐、基于自定义模型的实时推荐,以及基于内容的、和基于Item-CF的离线相似推荐。整个项目具有很强的实操性和综合性,对已有的大数据和机器学习相关知识是一个系统性的梳理和整合,通过学习,同学们可以深入了解推荐系统在电商企业中的实际应用,可以为有志于增加大数据项目经验的开发人员、特别是对电商业务领域感兴趣的求职人员,提供更好的学习平台。适合人群:1.有一定的 Java、Scala 基础,希望了解大数据应用方向的编程人员2.有 Java、Scala 开发经验,了解大数据相关知识,希望增加项目经验的开发人员3.有电商领域开发经验,希望拓展电商业务场景、丰富经验的开发人员4.有较好的数学基础,希望学br习机器学习和推荐系统相关算法的求职人员

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值