用于推荐系统评估的概念与指标

推荐系统的评估不仅关注预测准确性,还包括实用性、新颖性、多样性等多个维度。实用性,即用户满意度,可通过误差度量、精确度、召回、ROC曲线和排序指标来衡量。在线评估中,点击率和存留率也是重要指标。本文深入探讨了这些评估概念及其在推荐系统中的应用。
摘要由CSDN通过智能技术生成

在推荐系统中,研究人员为了能让预测结果对用户提供更多价值,会关注用户满意度。鉴于推荐系统除了让用户购买更多的相似产品外,还必须对用户而言“有用”,研究人员还会关注用户在使用系统时的交互体验和消费体验。 目前,研究人员正在通过评估不同的指标来解决这个问题,而不是简单地通过预测准确度和机器学习技术。

推荐系统的性能应该由它为用户产生的价值来衡量。在推荐系统的评估问题上,目前有很多指标,比如说覆盖率、新颖性、多样性、惊喜度。这些评估方法名称各不相同。

有些学者把推荐系统中的新颖性、相关性、惊喜度等称其为“概念(concept )”,另一些学者则称其为“维度(dimensions)”,还有些人称其为“推荐系统评估的方法(measures of recommender system evaluation)”。

在本文中,我们将使用“概念”一词,指代评估推荐系统时的不同方面。在对现有概念归类后,我们将其分为了六大类:实用性、新颖性、多样性、奇异性、覆盖率、惊喜度和覆盖率。但还有一些概念未提及,如:信任、风险、鲁棒性、隐私、适应性和可扩展性。为了方便读者阅读,我们会把这几大概念用不同的篇幅呈现。

表1总结了本文在所有评估指标中使用的符号。
在这里插入图片描述

实用性

推荐系统的实用性有很多别称,例如相关性、有用性、推荐价值和用户满意度等。《推荐系统手册》(Recommender Systems Handbook)认为,实用性代表了用户在推荐时所获得的价值。如果用户喜欢推荐的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值