检索式问答指标
通用的表达形式
精确率
p
=
∣
R
∩
A
∣
∣
A
∣
p = \frac{|R \cap A|}{|A|}
p=∣A∣∣R∩A∣
召回率
r
=
∣
R
∩
A
∣
∣
R
∣
r= \frac{|R \cap A|}{|R|}
r=∣R∣∣R∩A∣
R R R为相关文档集, A A A为查询 q i q_{i} qi 在文档集 I 上查询返回的文档集, A ϵ I A \epsilon I AϵI, R ϵ I R \epsilon I RϵI。
混淆矩阵表示形式
相关(relevant) | 不相关(nonrelevant) | |
---|---|---|
返回(retrieved) | 真正例(true positives, tp) | 伪正例(false positives, fp) |
未返回(not retrieved) | 伪反例(false negatives, fn) | 真反例(true negatives, tn) |
精确率
p
=
t
p
t
p
+
f
p
p = \frac{tp}{tp + fp}
p=tp+fptp
召回率
r
=
t
p
t
p
+
f
n
r = \frac{tp}{tp + fn}
r=tp+fntp
准确率
a
(
a
c
c
u
r
a
c
y
)
=
(
t
p
+
t
n
)
(
t
p
+
f
p
+
f
n
+
t
n
)
a(accuracy) = \frac{(tp+tn)}{(tp+fp+fn+tn)}
a(accuracy)=(tp+fp+fn+tn)(tp+tn)
参考
欢迎关注公众号: