#Paper Reading# On Sampled Metrics for Item Recommendation

最新推荐文章于 2021-02-20 18:00:00 发布

John159151

最新推荐文章于 2021-02-20 18:00:00 发布

阅读量596

点赞数

分类专栏： paper reading

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/John159151/article/details/108682346

版权

paper reading 专栏收录该内容

99 篇文章 4 订阅

订阅专栏

论文题目: On Sampled Metrics for Item Recommendation
论文地址: https://dl.acm.org/doi/abs/10.1145/3394486.3403226
论文发表于: KDD 2020 best paper（CCF A类会议）

论文大体内容：
本文主要论述了在推荐领域中，使用采样testset进行evaluate来比较各个模型，有可能会得出相反的结论。

Motivation：
数据量太大，所以工业界很多情况下都会选择采样。但是采样后计算的指标，是否与不采样的一致呢，这个问题本文从理论上去证明。

Contribution：
本文作者从理论上证明采样对验证带来的bais，以及修正方法。

1. 采样前采样后各项指标的比较，可以容易得出相反的结论。

2. 采样数据越多（样本量越接近100%），则指标也越接近真实值。

3. 理论证明部分请见原文。

4. 作者建议可以使用多采样几次，比如随机种子或者N折交叉验证，去规避这个问题。

实验
5. Dataset
①real dataset；
②Movielens 1M；

6. 实验结果

以上均为个人见解，因本人水平有限，如发现有所错漏，敬请指出，谢谢！

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
#Paper Reading# On Sampled Metrics for Item Recommendation

论文题目: On Sampled Metrics for Item Recommendation论文地址: https://dl.acm.org/doi/abs/10.1145/3394486.3403226论文发表于: KDD 2020 best paper论文大体内容：本文主要论述了在推荐领域中，使用采样testset进行evaluate来比较各个模型，有可能会得出相反的结论。Motivation：数据量太大，所以工业界很多情况下都会选择采样。但是采样后计算的指标，是否与不采样的一致呢，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。