模型评估指标

模型评估指标

离线模型评估指标:MRR、MR、HITS@n

MRR的全称是Mean reciprocal rank 。reciprocal rank是第一个正确答案的排名的倒数。MRR是指多个查询语句的排名倒数的均值。该指标越大越好。具体的计算方法如下:

                 

MR的全称是Mean Rank。该指标越小越好。具体的计算方法如下:

                   

HITS@n:第一个正确答案的排名小于n为1,否则为0;全部累加求平均值。一般地,取等于1、3或者10。该指标越大越好。具体的计算方法如下:

                   

不同模型适用该指标进行对比的范畴:数据规模一致。只要用于特征可用性筛选,包括用户特征、物品特征(eg:room)

评估指标实例

-------------- Test result --------------

Test average MRR : 0.21255047003007146

Test average MR : 940.4147869674185

Test average HITS@1 : 0.13283208020050125

Test average HITS@3 : 0.24060150375939848

Test average HITS@10 : 0.3634085213032581

-----------------------------------------

附件:

paper: https://arxiv.org/pdf/2004.08532.pdf

blog:知识图谱常用指标:MRR、Hits@1、Hits@10、MR_岁月求索-CSDN博客_mrr指标

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值