深度学习指标| 置信区间、Dice、IOU、MIOU、Kappa

最新推荐文章于 2025-03-24 14:30:25 发布

魔法自动机

最新推荐文章于 2025-03-24 14:30:25 发布

阅读量4.0k

点赞数 28

分类专栏：人工智能文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/qq_40306845/article/details/134594431

版权

人工智能专栏收录该内容

21 篇文章

订阅专栏

深度学习部分指标介绍

置信区间
混淆矩阵
Dice
IOU和MIOU
Kappa

置信区间

95%CI指标
读论文的时候，常会看到一个“95%CI”的评价指标。

其中CI指的是统计学中的置信区间（Confidence interval，CI）。在统计学中，一个概率样本的置信区间，是对产生这个样本的总体的参数分布中的某一个未知参数值，以区间形式给出的估计。

这样解释有点抽象，直观理解可以为“用样本估计总体平均值，给出总体均值最有可能落的区域”。

置信区间怎么得到？
下面用一个例子理解来最直观理解一下“置信区间”得到的过程。

一个10人的班级，这是每个人考的分数。

学生1	学生2	学生3	学生4	学生5	学生6	学生7	学生8	学生9	学生10
60	70	80	90	66	72	88	91	65	75

在已经知道全部学生成绩的时候，可以很好推出平均值为75.7。

但是现实生活中，通常需要计算的总体数量很大，我们是没办法在上帝视角下知道总体所有的值，例如需要知道全市所有学生的平均成绩，这个时候我们只能采用抽样的方式来估计。

从这10个人里，取出3个人作为抽样标本并计算其平均值，取5组。

学生1、2、5：65.3
学生3、4、8：87
学生4、6、7：83.3
学生7、8、9：81.3
学生3、6、9：72.3

每次抽样取平均值实际上就是在对全部学生平均成绩的一次点估计，点估计估计一个值，笃定了这个值是精确。
但是这五次点估计，在不知道总体学生成绩的时候，我们也依旧不知道那个是最接近真实平均值的。

于是就有区间估计，区间估计估计了一个范围，认为这个区间内至少有一个值使得待定参数最接近于真实值。通常可以用点估计算出来的数据加上一个变动幅度形成一个区间。
但是就算估计出来了区间，也有可能这个区间未必包含或者很靠近真实平均值，依旧还是不知道那个是最好的区间。

于是又有了置信区间来知道这个区间范围包含真实值的可信度，来评估区间的好坏。

根据大数定理和中心极限定律，样本均值M服从正态分布：
$M\sim N(\mu,\frac{{\sigma}^2}{n})$

以 $\mu$ 为中心， $\sigma$ 是总体分布的标准差，面积为0.95的区间就是置信区间。95%置信区间可以理解为对总体抽样1000次，然后发现95%抽样均值分布在这个区间中。
在这里插入图片描述
但实际情况中我们是不知道真实的 $\mu$ 是多少的，可以用抽样样本均值替代。

混淆矩阵

因为后面说Dice、IOU和MIOU要用到混淆矩阵的一些概念，所以放在这里方便理解。

	预测为正类别	预测为负类别
实际为正类别	True Positive (TP)	False Negative (FN)
实际为负类别	False Positive (FP)	True Negative (TN)

混淆矩阵中TP、TN、FP、FN：
TP（True Positives）：预测为正类别，并且预测对了
TN（True Negatives）：预测为负类别，而且预测对了
FP（False Positives）：预测为正类别，但是预测错了
FN（False Negatives）：预测为负类别，但是预测错了