排序指标NDCG(Normalized distributed cumulative gain)
- 归一化累积折扣信息增益值:用于衡量排序质量
- 逐步介绍 CG->DCG->NDGC
CG:衡量推荐结果的相关度
-
在NDCG中,相关度分成从0到r+1的等级(r是可设定的):
- 相关度可以自己定义,?:
2^r-1
CG = \sum_{i=1}^{n}2^r-1
- DCG:D代表折算因子,一般情况下,希望排在前面的结果更加与用户相关
D=\frac{log(2)}{log(1+i)}
DCG = \sum_{i=1}^{n}2^r-1*D
- IDCG 理想情况下(每次都能推荐n个item)
IDCG_p = \sum_{i=1}^{p}\frac{2^r(i)-1}{log_2(i+1)}
- 但是。。。
- 可能出现结果少于n个的情况,少于n个的结果NDCG与其他的一起比较是不公平的。因此需要归一化:
NDCG_p = \frac{DCG_p}{IDCG_p}