NDCG 详解
1. CG
累积增益(CG)是DCG的前身,并且在考虑结果集的有用性时不包括结果的位置。以这种方式,它是搜索结果列表中所有结果的分级相关值的总和。
- 特定等级位置p的CG定义为:
2. DCG
DCG的前提是在搜索结果列表中出现较低的高度相关文档应该受到惩罚,因为分级相关值与结果的位置成对比地减小。
-
DCG的传统公式累积在特定的等级位置p的定义为:
-
另一种表述形式:
后一种配方通常用于工业,包括主要的网络搜索公司[5]和数据科学竞争平台,如Kaggle。
3. NDCG(标准化折扣累积增益)计算
-
其中IDCG是理想的折扣累积收益,|REL|表示评分的个数,reli 表示第i项目的评分