统计推断基础

内容参考自Quora回答

根据随机变量分布进行统计推断

假定有一个随机变量 Y Y ,已知其分布。如果要获得对该变量的一个最合理估计值,应该取多少呢?
如果记随机变量Y的估计值为 t t ,则随机变量估计值的平方误差期望值可以表示为:

E[(Yt)2]=E(Y22Yt+t2)=E(Y)22tE(Y)+t2

上式对 t t 求导,可以得到
2E(Y)+2t=0t=E(Y)

由此可以得出,如果要最小化估计值的期望平方误差,那么最优的估计值 t=E(Y) t = E ( Y )

基于额外数据进行推断

进一步地,假设我们不仅了解随机变量 Y Y 的概率分布,还收集到了一些受随机变量Y影响的数据 X X ,此时,我们对于Y的最优推断将利用这些有用的数据。记 T(X) T ( X ) 为根据数据 X X 得到的对随机变量Y的估计值,此时平方误差损失记为:

E[(YT(X))2] E [ ( Y − T ( X ) ) 2 ]

X X 取值为x时,平方误差损失记为:
E[(YT(x))2|X=x] E [ ( Y − T ( x ) ) 2 | X = x ]

根据第一小节的结论,此时 T(x) T ( x ) 的最优估计值为 E(Y|X=x) E ( Y | X = x ) 。因此,对于任意的估计取值 T(X) T ( X ) :
E[(YE(Y|X=x))2|X=x]<=E[(YT(X))2|X=x] E [ ( Y − E ( Y | X = x ) ) 2 | X = x ] <= E [ ( Y − T ( X ) ) 2 | X = x ]

由于上式对任意点处 x x 均成立,因此,对上式左右两边求期望得到的平均值也成立:
E{E[(YE(Y|X=x))2|X=x]}<=E{E[(YT(X))2|X=x]}

进一步推导可得:
E[(YE(Y|X))2]<=E[(YT(X))2] E [ ( Y − E ( Y | X ) ) 2 ] <= E [ ( Y − T ( X ) ) 2 ]

由此可以得出结论:条件期望 E(Y|X) E ( Y | X ) 是最优估计值。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值