sufficient statistics

统计量是样本数据的函数,在统计学中,T(x) 为未知分布P的参数θ的充分统计量,当且仅当T(x)可以提供θ的全部信息,也就是说,没有统计量可以提供关于θ的额外信息。
统计量是实际上是一种对数据分布的压缩,在样本加工为统计量的过程中,样本中所含的信息可能有所损失,若在将样本加工为统计量时,信息毫无损失,则称此统计量为充分统计量。比如,在正态分布中, 我们可以用两个充分统计量统计量样本均值和样本方差描述整个数据分布。

统计量是数据的函数。函数就是一种”浓缩“信息的动作。因此, 统计量中所包含的信息, 通常比整个样本数据所包含的来得少。例如样本的顺序统计量只包含了有哪些值出现, 而不同值出现的次序这样的信息不见了。
但统计量比样本原数据少掉的信息可能是无关紧要的 —— 和我们要了解的群体特性不相干, 比如样本数据出现顺序在很多时候和我们关心的群体特性无关。若在将样本加工为统计量时,信息毫无损失,则称此统计量为充分统计量。在参数化模型, 比如正态分布,我们可以用样本平均数和样本方差这两个很简单的统计量囊括样本中所包含的全部信息。
一个随机变量的分布,取决于一些参数的值;充分统计量能够完全捕捉这些参数所包含的关于分布的信息。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值