【漫话机器学习系列】251.约登指数（Youden‘s Index）

IT古董

于 2025-05-10 10:04:45 发布

阅读量909

点赞数 10

分类专栏：漫话机器学习系列专辑文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/IT_ORACLE/article/details/147818400

版权

漫话机器学习系列专辑专栏收录该内容

253 篇文章

订阅专栏

详解约登指数（Youden's Index）：公式、理解与应用

在二分类模型的评估指标中，约登指数（Youden's Index）是一项非常重要但常被忽视的指标。今天，我们通过一张直观的图，系统地理解约登指数的公式、含义及其在实际建模中的应用。

什么是约登指数？

约登指数（Youden's Index, 简称 J）最早由生物统计学家 W.J. Youden 于1950年提出，主要用于衡量二分类模型整体分类性能的一致性和准确性。

约登指数综合考虑了模型正确识别正例和正确识别负例的能力，是二者的加权和减去 1 后的结果。

其数学定义为：

其中：

TP（True Positive）：真正例（模型正确预测为正例的样本数）
FN（False Negative）：假负例（模型错误预测为负例的正样本数）
TN（True Negative）：真负例（模型正确预测为负例的样本数）
FP（False Positive）：假正例（模型错误预测为正例的负样本数）

公式解析

根据公式，可以将约登指数理解为：

第一项：，即真正率（Sensitivity / Recall），衡量模型识别正样本的能力；
第二项：，即特异度（Specificity），衡量模型识别负样本的能力；
最后减去 1，是为了保证 J 的取值范围在 [-1, 1]。

总结：

约登指数 = 真正率 + 特异度 − 1

取值范围与含义

取值范围：
意义解释：
- J = 1：模型完美分类，所有样本预测正确；
- J = 0：模型没有分类能力，与随机猜测无异；
- J < 0：模型表现比随机猜测还差（极少出现）。

因此，J值越大越好，越接近 1，表示模型越优秀。

为什么使用约登指数？

在实际应用中，尤其是医学诊断、信用评估、异常检测等场景中，样本类别往往不均衡，仅依赖准确率（Accuracy）容易导致误判。

约登指数可以同时兼顾正负样本的预测性能，避免了偏倚问题。

特别是在选择模型分类阈值（例如 ROC 曲线上的最佳截断点）时，经常使用约登指数来指导：

选择最大化 J 的阈值，可以在 Sensitivity 和 Specificity 之间取得良好的平衡。
这比单纯地最大化某一个指标（如 AUC、准确率）更适合在敏感应用场景下进行决策。

举个简单例子

假设有如下模型预测结果：

实际/预测	正例 (P)	负例 (N)
正例 (P)	TP = 80	FN = 20
负例 (N)	FP = 10	TN = 90

计算各项指标：

真正率（Sensitivity） =
特异度（Specificity） =

代入公式：

J = 0.8 + 0.9 - 1 = 0.7

说明该模型在当前阈值下的整体预测性能较好。

与其他指标的对比

指标	关注重点	是否受类别不平衡影响
准确率 (Accuracy)	总体正确率	受影响
AUC	分类能力	抵抗性较好
F1分数 (F1-score)	正例预测性能	受影响
约登指数 (Youden's J)	同时考虑正负类预测	抵抗性较好

在类别不均衡的情况下（如罕见病检测、诈骗识别等），约登指数和AUC一样，是更加稳定和可靠的评估标准。

总结

约登指数综合了模型对正例和负例的预测能力，是二分类模型重要的性能评估指标；
其值介于 [-1, 1]，值越大，模型性能越好；
在需要选择 ROC 曲线最佳截断点或避免类别不均衡影响时，约登指数是一个非常实用的标准。

一句话总结：

约登指数，帮你找到分类模型“真正聪明”的决策点！

参考资料

Youden, W. J. (1950). "Index for rating diagnostic tests." Cancer, 3(1), 32–35.
Fawcett, T. (2006). "An introduction to ROC analysis." Pattern Recognition Letters.

如果你觉得这篇讲解清晰易懂，不妨点赞、收藏支持一下！