评价指标 | 名称 | 符号 | 偏好 | 是否依赖于推荐列表长度 | 备注 | |
准 确 度 | 预测评分准确度 | 平均绝对误差 | MAE | 小 | 否 | 适用于比较关注精确的预测评分的系统 |
平均平方误差 | MSE | 小 | ||||
均方根误差 | RMSE | 小 | ||||
标准平均绝对误差 | NMAE | 小 | ||||
预测评分关联 | Pearson关联 | PCC | 大 | 适用于不关注精确预测评分的系统,其中NDMP适用于弱排序 | ||
Spearman关联 | 大 | |||||
Kendall’s Tau |
| 大 | ||||
基于距离的标准指标 | NDMP | 大 | ||||
分类准确度 | 准确率 | P(L) | 大 | 是 | 除AUC外,其他不适用于没有明确二分喜好的系统
| |
召回率 | R(L) | 大 | ||||
准确率提高率 | 大 | |||||
召回率提高率 | 大 | |||||
F1指标 | 大 | |||||
ROC曲线面积 | AUC | 大 | 否 | |||
排序准确度 | 平均排序分 | RS | 小 | 否 | 适用于对推荐排序要求严格的系统 | |
基于排序加权的指标 | 半衰期效用指标 | HL(L) | 大 | 是 | 考虑了具体的推荐排序值,更合理些 | |
折扣累计利润 | DCG(b,L) | 大 | ||||
排序偏差准确率 | RBP(p,L) | 大 | ||||
覆盖率 | 预测覆盖率 | 大 | 否 | 种类覆盖率指标需要先对商品种类分类,这些指标单独使用没有意义,应与准确度指标一起考虑 | ||
推荐覆盖率 | 大 | 是
| ||||
种类覆盖率 | 大 | |||||
多样性 | Inter-user diversity | H (L) | 大 | |||
Intra-user diversity | I(L) | 小 | ||||
新颖性 | 推荐商品平均度 | N(L) | 小 | |||
系统的自信息量 | U(L) | 大 | ||||
推荐的新颖率 | UE | 大 | ||||
考虑排序的推荐新颖率 | UER | 大 |