AI基础——置信度

“置信”一词从中文角度,只能从“难以置信”这个成语中找到。
在数理统计中初看这个概念,有点模糊。
今天来探究一下置信这个统计学概念是啥意思。

术语百科

首先给出百科中关于置信的解释:
在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。
置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。
置信区间给出的是被测量参数测量值的可信程度范围,即前面所要求的“一定概率”。这个概率被称为置信水平。

举例说明

举一个同样是百科中的例子:
如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%,60%),那么他的真实支持率有百分之九十五的概率落在百分之五十和百分之六十之间,因此他的真实支持率不足一半的可能性小于百分之2.5(假设分布是对称的)。

在这里插入图片描述
如何理解呢?

首先,探讨一下支持率这个概念,可以理解为这个国家中所有人口中有多少人支持他。 比如总人口是1亿,有5000w人支持,那么支持率就是50%。 这只是个理想值,调研这一亿人的每一个人是不可能的,但理论上他一定是存在且精准的值。

其次,如何获得支持率呢? 大家马上想到一个办法,就是找一部分代表去投票,然后“以偏概全”,用这些代表投票的支持率去估计整个国家的支持率。 思考一下,假设这些代表的投票结果是55%,那么按照上面支持率的概念,这个国家一定有55%的人支持吗? 当然不一定啦,因为这只是个估计,那个精确且存在的支持率到底是多少,谁也不知道!

最后,那有没有一个更精准的表达呢? 有的,就像其它数学概念一样,数学家们发明了置信区间和置信度两个词来描述这件事。 精准支持率落在50%到60%之间的概率在95%以上! 这句话在数学上多么严谨啊(现实中没有啥卵用,总统不可能根据概率产生,这里不讨论)。 再加上一句话:精准支持率不到50%的概率小于2.5%,当然还有另一部分,精准支持率高于60%的概率也小于2.5%。

上面的50%到60%就是置信区间,概率95%就是置信度了。

另:对上面的分布是不是很熟悉,这不正是左右对称的正态分布么…

总结

简单说,置信就是对估计的可信度的评估,或者数学化。
估计这东西在非此即彼、非对即错的数学世界,显得太“难以置信”了。
有了置信的加持,一切都更“数学”了。

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值