排序指标NDCG(Normalized distributed cumulative gain)

排序指标NDCG(Normalized distributed cumulative gain)

  • 归一化累积折扣信息增益值:用于衡量排序质量
  • 逐步介绍 CG->DCG->NDGC

CG:衡量推荐结果的相关度

  • 在NDCG中,相关度分成从0到r+1的等级(r是可设定的):

    • 相关度可以自己定义,?:
2^r-1
CG = \sum_{i=1}^{n}2^r-1
  • DCG:D代表折算因子,一般情况下,希望排在前面的结果更加与用户相关
D=\frac{log(2)}{log(1+i)}
DCG = \sum_{i=1}^{n}2^r-1*D
  • IDCG 理想情况下(每次都能推荐n个item)
IDCG_p = \sum_{i=1}^{p}\frac{2^r(i)-1}{log_2(i+1)}
  • 但是。。。
  • 可能出现结果少于n个的情况,少于n个的结果NDCG与其他的一起比较是不公平的。因此需要归一化:
NDCG_p = \frac{DCG_p}{IDCG_p}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是对评价指标NDCG、AUC、ACC、Precision和Recall的简要介绍: 1. NDCG (Normalized Discounted Cumulative Gain):NDCG是用于衡量排序算法性能的指标,常用于评估推荐系统的排序质量。它考虑了推荐列表中每个项目的相关性和排序位置,通过对相关性进行折扣和累加来计算得分,然后将得分标准化,使得评估结果在0到1之间,越接近1表示排序质量越好。 2. AUC (Area Under the ROC Curve):AUC是用于衡量分类算法性能的指标,常用于评估二分类问题的预测准确性。ROC曲线是以真正例率(True Positive Rate)为纵轴,假正例率(False Positive Rate)为横轴绘制的曲线,AUC则是ROC曲线下的面积。AUC越接近1表示分类器性能越好。 3. ACC (Accuracy):ACC是用于衡量分类算法性能的指标,表示分类器正确预测的样本占总样本数的比例。ACC通常用于评估多分类问题中分类器的准确性,取值范围为0到1,越接近1表示分类器性能越好。 4. Precision (精确率):Precision是用于衡量分类算法性能的指标,表示分类器在预测为正例的样本中,真正例的比例。精确率主要关注分类器的预测准确性,计算公式为真正例数除以真正例数加上假正例数。 5. Recall (召回率):Recall是用于衡量分类算法性能的指标,表示分类器成功预测为正例的样本占所有真正例的比例。召回率主要关注分类器对正例的全面性,计算公式为真正例数除以真正例数加上假负例数。 这些评价指标在不同的任务和场景中有不同的应用,可以帮助评估模型的性能和效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值