#Paper Reading# On Sampled Metrics for Item Recommendation

论文题目: On Sampled Metrics for Item Recommendation
论文地址: https://dl.acm.org/doi/abs/10.1145/3394486.3403226
论文发表于: KDD 2020 best paper(CCF A类会议)

论文大体内容:
本文主要论述了在推荐领域中,使用采样testset进行evaluate来比较各个模型,有可能会得出相反的结论。

Motivation:
数据量太大,所以工业界很多情况下都会选择采样。但是采样后计算的指标,是否与不采样的一致呢,这个问题本文从理论上去证明。

Contribution:
本文作者从理论上证明采样对验证带来的bais,以及修正方法。


1. 采样前采样后各项指标的比较,可以容易得出相反的结论。
 

2. 采样数据越多(样本量越接近100%),则指标也越接近真实值。
 

3. 理论证明部分请见原文。

4. 作者建议可以使用多采样几次,比如随机种子或者N折交叉验证,去规避这个问题。

实验
5. Dataset
①real dataset;
②Movielens 1M;

6. 实验结果


以上均为个人见解,因本人水平有限,如发现有所错漏,敬请指出,谢谢!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值