SIGIR2021@Elliot | 一个全新且全面的推荐系统Benchmark

最新推荐文章于 2024-03-02 21:14:18 发布

机器学习与推荐算法

最新推荐文章于 2024-03-02 21:14:18 发布

阅读量737

点赞数

文章标签：算法 python 机器学习人工智能大数据

本文链接：https://blog.csdn.net/weixin_44289754/article/details/122834201

版权

嘿，记得给“机器学习与推荐算法”添加星标

今天给大家推荐一个全面且严谨的面向学术界的推荐系统评测基准库Elliot，该库提供了36种全面的评测指标（比如准确性、偏差、公平性、新颖度以及多样性等评价指标），还提供了13种关于数据集的分离策略（Spliting methods），8种过滤策略（Filtering approaches），27种相似性选择，2种统计假设检验以及51种关于超参数搜索以及优化的策略。相比于其他的推荐算法基准库，可谓是比较全面且完整的。

该库对应的论文发表在SIGIR2021上，论文链接如下：

https://arxiv.org/abs/2103.02590

该库对应的github链接如下：

https://github.com/sisinflab/elliot

该算法库共包括了8个功能模块，其中包括数据加载（Loading）、数据过滤（Filtering）、数据分离（Spliting）、推荐模型（Models）、超参数优化、评测指标（Metrics）、模型输出（Outputs）以及假设检验等模块。

其中，数据加载模块可以引入除评分数据（Rating）之外的其他辅助信息（Side information），比如物品的特征信息以及知识图谱信息等；数据过滤模块提供了按照评分进行过滤的模式（Filter-by-rating）以及按照交互数量进行过滤的模式（K-core）。数据分离模块提供了按照时序、随机以及固定的模式进行数据划分。推荐模型模块实现了包括经典的推荐模型、基于图的推荐模型以及基于生成对抗网络的推荐模型等。

超参数优化模块实现了网格搜索、模拟退火、贝叶斯优化以及随机搜索等策略。评价指标模块实现了准确性、覆盖率、新颖性、多样性、偏置、错误率以及公平性等相对全面的评价指标。另外，假设检验模块提供了Wilcoxon以及Paired t-test统计假设检验的选项。

该算法库在数据过滤、数据分离以及超参数优化方面提供了全面的模式设置，通过下图与同类型推荐算法库（LibRec、RecBole以及RecQ等）的比较可以看出其全面性。