【深度学习: C-统计量】C-统计量:定义、示例、权重和显著性
什么是 C 统计量?
一致性统计量等于ROC曲线下的面积。
c统计量(有时称为“一致性”统计量或c指数)是对逻辑回归模型中二元结果的拟合优度的度量。在临床研究中,c -统计量给出了随机选择的经历过某一事件(如疾病或状况)的患者比没有经历过该事件的患者具有更高风险评分的概率。它等于受试者工作特征(ROC)曲线下的面积,取值范围为0 ~ 1。
- 值低于0.5表示模型非常差。
- 值为0.5意味着模型的预测结果并不比随机机会好。
- 值超过0.7表示模型良好。
- 超过0.8的值表示强模型。
- 值为1意味着该模型完美地预测了哪些群体成员将经历某种结果,哪些不会。
c统计量并不常用,因为它只能给你一个关于模型的一般概念;ROC曲线包含更多关于准确性、敏感性和特异性的信息。
权重
当无法预测阳性结果(如癌症检测)的成本高于正确预测阴性结果的收益时,使用加权c指数。加权会惩罚导致正面和负面结果的小概率差异的模型,但不会改变c统计量的值。它也可以用来调整分层随机抽样。
统计显著性
与大多数统计数据一样,c统计数据有时与置信区间配对。例如,结果可能为0.63,置信区间从0.53到0.73)。一般来说,任何包含0.5的结果都是不显著的,即使它包含了相关的c统计量。例如,CI范围从0.43到0.83的0.63结果并不显著,因为它在该范围内包含0.5。