MLaPP Chapter 6 Frequentist statistics 频率学派统计学

6.1 Introduction

频率学派统计学(frequentist statistics),经典统计学(classical statistics),或者叫正统的统计学(orthodox statistics),设计了一些不把参数当做随机变量的统计推断方法,从而避免了使用贝叶斯法则和先验。

频率学派依赖于抽样分布(sampling distribution),而贝叶斯学派则依赖后验分布(posterior distribution)。

6.2 Sampling distribution of an estimator 估计量的抽样分布

和贝叶斯学派相反,频率学派估计参数时,认为参数是固定的(而不是不确定量,不当做是随机变量,因此也没有先验之说),反而数据是不固定的,可以不断地抽样。比如从总体中抽 S 次,得到样本集 {D(s)}Ss=1 ,每个样本都有 N 个数据,即 D(s)={x(s)i}Ni=1 ,注意所有的样例都服从一个固定的分布,即 x(s)ip(|θ) 对所有的 i,s 都成立。

针对每个样本 D(s) ,可以用 estimator θ^() 算出一个统计量,如均值,方差等。当 S 时, { θ^(D(s))} 构成新的分布,就叫做是 estimator θ^() 的抽样分布(sampling distribution).

6.2.1 Bootstrap

一般用蒙特卡洛方法来估计抽样分布(sampling distribution),这种方法就叫做 Bootstrap 方法,而这种方法又分有参数和无参数两种。

继续用上一小节的符号,直接计算 estimator 的结果,每个样本都会得到一个随机变量的取值, θ^s=f(xs1:N) ,那么可以把经验分布当做是抽样分布。这种方法叫做 无参数 bootstrap,假如 estimator 中的参数 θ 是未知的,那么可以用最大似然估计出来的结果 θ^ 来计算,这种叫做 参数 bootstrap 方法。

6.2.2 Large sample theory for the MLE *

当样本数量趋向无穷大时,那么似然函数的分布趋向于高斯分布,那么高斯分布的中心就是 MLE 的估计结果 θ^ ,方差则是 MLE 整个曲面的弯曲情况。可以形式化地定义 score function 为似然函数对参数 θ 的偏导,

s(θ^)logp(D|θ)|θ^
再定义 observed information matrix 为上面负的 score function 的导数,
J(θ^(D))s(θ^)=2θlogp(D|θ)|θ^

Fisher information matrix 定义为 observed information matrix 的期望,

IN(θ^|θ)=Eθ[J(θ^|D)]

6.3 Frequentist decision theory 频率学派决策理论

上一章已经有了 estimator or decision procedure

δ:XA
的概念,在此基础上定义 风险(risk) 的概念,
R(θ,δ)Ep(D~|θ)[L(θ,δ(D~))]=L(θ,δ(D~))p(D~|θ)dD~
然而这个式子是没法直接计算的,所以衍生出下面几种方法。

6.3.1 Bayes risk 贝叶斯风险

第一种方法是加上一个合适的先验,发现会把未知量 θ 约去。定义贝叶斯风险(Baues risk)为

RB(δ)Ep(θ)[R(θ,δ)]=R(θ,δ)p(θ)dθ
那么 Bayes estimator 就是
δBargminδRB
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值