推荐系统常用评价指标

自己在网上查询了很多推荐指标包括准确率,精确率,召回率,P-R曲线,AUC曲线,MAP,MRR,NDCG评价指标。
但是分类模型的评价指标和推荐系统的指标的计算方法是不一样的,分类模型评价指标计算是根据混淆矩阵进行计算,而推荐模型是根据推荐列表和分割的20%测试集作为真实值进行计算。
在分类模型中,是明确知道分类的明确信息,比如哪个属于正样本,哪些属于负样本,而在推荐系统中我们只是将测试集作为正样本进行计算,分类模型中的假阳性等信息并不知道。因为推荐列表不像分类问题一样,将不出现测试集中的样本看成是负样本(因为我们无法判断用户对于没访问过的项目是不是真的不感兴趣),因此准确率(正确分类样本数/样本总数,正确分类数包括正负样本),P-R曲线,AUC曲线这些评价指标无法或很少在推荐系统使用

推荐系统的常用指标:精确率,召回率,F1-Score,MAP,NDCG
推荐系统准确率计算方法:
精确率=||推荐集 并 测试集||/||测试集|| #又叫查全率,用于评价模型查的全不全
召回率=||推荐集 并 测试集||/||推荐集|| #又叫查准率,用于评价模型查的信息准不准
上面两个评价指标会相互制约,最好的情况是两者结果都为1,。通常另一个大会导致领一个小。
举个极端的例子,如果推荐集包含全部元素了,而测试集包括很少,这时候精确率为1,而召回率为几乎为0.
最好的情况是推荐集和测试集的项目一模一样,这时候是最好的情况,都为1.

MAP和NDCG的计算:
https://blog.csdn.net/simple_the_best/article/details/52296608
https://www.cnblogs.com/baiting/p/5138757.html
MAP和NDCG理解:
MAP只是希望我们想要的信息项目靠前,比如我们想要(a1,a2,a3),一个推荐列表【a1,a2,a3,b1,b2,b3】要比【,b1,b2,b3,a1,a2,a3】的分数高。但是【a1,a2,a3,b1,b2,b3】和【a3,a2,a1,b1,b2,b3】得到的结果一样,显然第一种情况好,因此这种评价指标无法解决这个问题
针对上面MAP存在的问题,提出了NDCG评价指标,该指标通常用于网页的搜索排名中,不仅让想要的信息的排名信息靠前,也让和信息(比如搜索关键字)更相关的信息排名靠前的推荐列表的分数也越大。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值