从分类,排序,top-k多个方面对推荐算法稳定性的评价

最新推荐文章于 2022-07-05 18:13:01 发布

phantom66

最新推荐文章于 2022-07-05 18:13:01 发布

阅读量9.1k

点赞数

分类专栏：推荐系统算法数据挖掘文章标签：推荐系统稳定性评价

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ghostlv/article/details/51225972

版权

数据挖掘同时被 3 个专栏收录

10 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

介绍

论文名: “classification, ranking, and top-k stability of recommendation algorithms”.
本文讲述比较推荐系统在三种情况下, 推荐稳定性情况.
与常规准确率比较的方式不同, 本文从另一个角度, 即推荐算法稳定性方面进行比较.

详细

参与比较的推荐算法

包括:

baseline
传统基于用户
传统基于物品
oneSlope
svd

比较方式

比较的过程分为两个阶段:

阶段一, 将原始数据分为两个部分, 一部分为已知打分, 另一部分为未知打分, 用于预测.
阶段二, 在用于预测打分那部分数据中, 取出一部分数据, 加入到已知打分部分, 剩余部分仍然为预测部分.

比较阶段一中的预测结果和阶段二中预测结果的比较.
数据划分情况如图所是.

数据划分

比较的方式

预测稳定性

预测性的评价方式有以下几种:
MAE, RMSE

分类稳定性

分类型的评价方式有以下几种:
准确率, 召回率, F-分数.

排名稳定性

排名型的评价方式有以下几种:
排名相关性, Spearman的 $\rho$ 评价, Kruskal的 $\gamma$ 评价, Kendall的 $\tau$ 评价.

前K项稳定性

前k项的评价方式有以下几种:
点击率稳定性(hit-rate), NDCG(normalized discounted cumulative gain).

比较的场景

稀疏性冲击

改变数据的稀疏性, 从几个方面比较这些推荐算法的稳定性.

结果如图所是.

这里写图片描述

基于内存的推荐算法和slopeone算法表现出强烈的不稳定性和对数据敏感性.
svd和baseline算法相对稳定.

评价数量冲击

改变第二阶段中新加入数据的数量, 比较两次实验的差异.

结果如图所是:

这里写图片描述

横坐标为比例, 即已知打分数据的倍数, 从10%到500%.

从图中可以看出, 在新加入的数据较少时, 各个推荐算法表现出高度的稳定性.

当新加入的数据较多时, 基于内存的推荐算法的稳定性不断下降.
相反, 基于模型的方法相对稳定.

打分分布冲击

除了新加入的数据外, 新加入的数据的数据分布也一定程度上影响了推荐算法的稳定性.

下表显示了修改数据分布的策略:

这里写图片描述

实验的结果如下:

这里写图片描述

从图中可以看出, 当加入的数据为随机时, 各个推荐算法都表现出相对较高的稳定性.
但是, 当添加的数据出现歪斜时, 基于内存的推荐算法的稳定性降低较快, 基于模型的推荐算法的稳定性基本保持不变.

算法参数冲击

对于推荐算法而言, 除了数据的因素外, 还有算法本身参数对算法稳定性的影响.

对于基于内存的算法, 相似用户/物品的数量影响着推荐算法的效果,
对于svd算法, 隐含属性的数量影响着推荐算法的结果.

实验通过修改推荐算法参数的方式进行比较, 结果如图所时:

这里写图片描述

对于top-K的比较, k值的大小也影响推荐算法的稳定性.
通过修改k的大小, 实验的结果如图所时:

这里写图片描述

实验结果表示:

对于修改算法的参数, 对svd算法的影响较少, 对于基于内存的算法影响较大.

修改top-k中k的大小, 对基于模型的推荐算法影响较小, 对于基于内存的推荐算法的稳定性影响较大.

总结

对于上面多种情况的比较.
基于模型的推荐算法在多种情况下, 稳定性较高, 特别时svd算法.
基于内存的推荐算法稳定性较差.

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。