简介
DCG, Discounted Cumulative Gain ,累计收益折扣.
A measure of ranking quality. 是信息检索领域中, 对排序问题的一个评价指标, 因素有文档相关性
与排序位置
.
Q: 与推荐场景常用的AUC, 有何区别?
A: DCG侧重于样本分档, 而非简单的 正/负 sample.
使用场景举例:
- 用户输入一个query, 得到了很多结果, 这个指标可以对有序的结果进行评价.
- 相关场景: 文档打标签, 把程序的标签输出也看成有序的, 就也可以用该指标评价.
思想
This measure is based on two following assumptions:
- 高度相关文档在排名靠前时, 对用户的帮助更大
- 高度相关文档比轻微相关文档, 对用户的帮助更大
公式
D
C
G
k
=
∑
i
=
1
k
r
e
l
i
log
2
(
i
+
1
)
\mathrm{DCG_k} = \sum_{i=1}^{k} \frac{rel_{i}}{\log_{2}(i+1)}
DCGk=i=1∑klog2(i+1)reli
where
r
e
l
i
rel_{i}
reli is i-th doc’s relevant score.
k
k
k is the rank position.
根据k=3(或 10)取值不同, 算出来的就是 前3(或 前10) 个结果的DCG.
nDCG
nDCG, Normalized DCG , 正规化的累计收益折扣.
不同的query, 搜索结果的个数不一致, 所以需要正规化.
IDCG, 表示在理想情况下, 这些文档按照相关性单调递减排序时的DCG得分.
n D C G k = D C G k I D C G p \mathrm{nDCG_{k}} = \frac {DCG_k} {IDCG_p} nDCGk=IDCGpDCGk
GSB
通常用于两个模型之间的对比, 而非单个模型的评测.
Δ
G
S
B
=
#
g
o
o
d
−
#
b
a
d
#
g
o
o
d
+
#
s
a
m
e
+
#
b
a
d
\Delta GSB=\frac{\#good-\#bad}{\#good+\#same+\#bad}
ΔGSB=#good+#same+#bad#good−#bad
场景为已经有了一版模型A, 现在迭代了一版模型B, 评估B是否更优于A
<query,doc> | B模型比A模型的提升 |
---|---|
q1,d1 | good |
q2,d2 | same |
q3,d3 | bad |
q4,d4 | bad |
按照上表的统计,
Δ
G
S
B
=
−
1
/
4
\Delta GSB=-1/4
ΔGSB=−1/4, 不能上线.