贝叶斯统计决策理论

决策问题的三要素

  • 状态集 Θ \Theta Θ={ θ \theta θ},其中每个元素 θ \theta θ表示自然界或社会可能出现的一种状态,所有可能状态的全体组成状态集。
  • 行动集 A \mathscr{A} A={ a \mathscr{a} a},其中每个元素 a \mathscr{a} a表示人对自然界或社会可能采取的一个行动,所有此行动的全部就是行动集。
  • 收益函数 Q Q Q( θ \theta θ, a \mathscr{a} a)。

决策准则

  • 行动的容许性
    在给定的决策问题中, A \mathscr{A} A中的行动 a 1 a_{1} a1称为是容许的,假如在 A \mathscr{A} A中不存在满足如下两个条件的行动 a 2 a_{2} a2
    1.对所有的 θ \theta θ ∈ \in Θ \Theta Θ,有 Q Q Q( θ \theta θ, a 1 a_{1} a1) ≥ \geq Q( θ \theta θ, a 2 a_{2} a2);
    2.至少有一个 θ \theta θ,可使上述不等式严格成立。
  • 悲观准则:最小最大收益,保守。
  • 乐观准则:最大最大收益,冒险。
  • 折中准则:悲观与乐观的加权。

先验期望准则

  • 先验期望收益
    对给定的决策问题,若在状态集 Θ \Theta Θ上有一个正常的先验分布 π \pi π( θ \theta θ),则收益函数 Q Q Q( θ \theta θ,a)对 π \pi π( θ \theta θ)的期望与方差
    在这里插入图片描述
    在这里插入图片描述
    分别称为先验期望收益和收益的先验方差。使先验平均收益达到最大的行动 a ′ a^{'} a
    在这里插入图片描述
    称为先验期望准则下的最优行动。若此种最优行动不止一个,其中先验方差达到最小的行动称为二阶矩准则下的最优行动。

损失函数

在这里插入图片描述

  • 悲观准则:最大最小损失,保守。
  • 损失函数下的先验期望准则
    对给定的决策问题,若在状态集上有一个正常的先验分布 π \pi π( θ \theta θ),则损失函数 L L L( θ \theta θ, a \mathscr{a} a)对 π \pi π( θ \theta θ)的期望与方差
    在这里插入图片描述
    在这里插入图片描述
    分别称为先验期望损失和先验方差,使先验期望损失达到最小的行动 a ′ a^{'} a
    在这里插入图片描述
    称为先验期望准则下的最优行动,若此种最优行动不止一个,其中先验方差达到最小的行动称为二阶矩准则下的最优行动。
  • 二行动线性决策问题的损失函数
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

贝叶斯决策

  • 后验风险
    我们把损失函数 L L L( θ \theta θ, a \mathscr{a} a)对后验分布 π \pi π( θ \theta θ| x \mathscr{x} x)的期望称为后验风险,记为 R R R( a \mathscr{a} a| x \mathscr{x} x),即
    在这里插入图片描述

  • 决策函数
    在给定的贝叶斯决策问题中,从样本空间 X \mathscr{X} X={ x \mathscr{x} x=( x 1 x_{1} x1, x 2 x_{2} x2,… x n x_{n} xn)}到行动集 A \mathscr{A} A上的一个映照 δ \delta δ( x \mathscr{x} x)称为该决策问题的一个决策函数。所有从 X \mathscr{X} X A \mathscr{A} A上的决策函数组成的类称为决策函数类,用 D D D={ δ \delta δ( x \mathscr{x} x)}表示。

  • 后验风险准则
    在给定的贝叶斯决策问题中 D D D={ δ \delta δ( x \mathscr{x} x)}是其决策函数类,则称
    在这里插入图片描述
    为决策函数 δ \delta δ= δ \delta δ( x \mathscr{x} x)的后验风险。假如在决策函数类 D D D中存在这样的决策函数 δ \delta δ’= δ \delta δ( x \mathscr{x} x),它在D中具有最小的后验风险
    在这里插入图片描述
    则称 δ \delta δ’( x \mathscr{x} x)为后验风险准则下的最优决策函数,或称贝叶斯决策函数,或贝叶斯解。当参数空间 Θ \Theta Θ与行动集 A \mathscr{A} A相同,均为某个实数集时,满足上式的 δ \delta δ’( x \mathscr{x} x)又称为 θ \theta θ的贝叶斯解或贝叶斯估计。

抽样信息期望值

  • 完全信息期望值
    在这里插入图片描述

  • 完全信息后验期望值
    后验 E V P I EVPI EVPI(Expected Value of Perfect Information)=
    在这里插入图片描述
    后验 E V P I EVPI EVPI的期望值=
    在这里插入图片描述

  • 抽样信息期望值
    在这里插入图片描述

  • 最佳样本量的确定

  • 抽样成本
    由固定成本 C f C_{f} Cf与可变成本 C v C_{v} Cv· n \mathscr{n} n组成,即
    在这里插入图片描述

  • 抽样净益(Expected Net Gain From Sampling),记为ENGS,即
    在这里插入图片描述

  • 最佳样本量
    使得抽样净益达到最大且样本量最少的 n ∗ n^{*} n称为最佳样本量,即 n ∗ n^{*} n满足
    在这里插入图片描述
    要使抽样成为可行,抽样成本 C ( n ) C(n) C(n)不应超过抽样信息期望值 E V S I ( n ) EVSI(n) EVSI(n),而 E V S I ( n ) EVSI(n) EVSI(n)也不会超过先验完全信息期望值 E V P I EVPI EVPI。由此可知,最佳样本容量 n ∗ n^{*} n应满足如下不等式
    在这里插入图片描述
    在这里插入图片描述

统计决策理论

  • 风险函数
    仅使用抽样信息的决策问题称为统计决策问题。设 δ \delta δ( x x x)是某一统计决策问题中的决策函数。 δ \delta δ( x x x)的风险函数定义为
    在这里插入图片描述

  • 最小最大准则

  • 贝叶斯风险
    对给定的统计决策问题和给定的决策函数类 A \mathscr{A} A,设决策函数 δ \delta δ( x x x)的风险函数为 R R R( θ \theta θ, δ \delta δ( x x x)),又设 θ \theta θ的先验分布为 π \pi π( θ \theta θ),则风险函数对先验分布的期望
    在这里插入图片描述
    称为 δ \delta δ( x x x)的贝叶斯风险,假如在决策函数类 A \mathscr{A} A中存在这样的决策函数 δ ∗ \delta^{*} δ( x x x),使得
    在这里插入图片描述
    则称 δ ∗ \delta^{*} δ( x x x)为在贝叶斯风险准则下的最优决策函数。

  • 贝叶斯风险准则与后验风险准则的等价性
    在这里插入图片描述
    下面转入等价性的讨论,为此设
    δ ∗ \delta^{*} δ为使贝叶斯风险准则下的最优决策函数。
    δ ∗ ∗ \delta^{**} δ为使后验风险准则下的最优决策函数。
    在这里插入图片描述
    在这里插入图片描述
    这表明:使后验风险最小的决策函数 δ ∗ ∗ \delta^{**} δ同时也使贝叶斯风险最小。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    这表明:使贝叶斯风险最小的决策函数 δ ∗ \delta^{*} δ同时也使后验风险最下。
    综上所述,后验风险准则与贝叶斯风险准则等价。

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值