经验分布函数与 bootstrap 方法

心态与习惯

已于 2022-04-17 17:12:25 修改

阅读量3.5k

点赞数 1

分类专栏：统计学/机器学习文章标签：经验分布函数抽样分布样本中心极限定理

于 2020-02-27 12:14:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/robert_chen1988/article/details/104533657

版权

统计学/机器学习专栏收录该内容

54 篇文章 35 订阅

订阅专栏

1. 经验分布函数

当总体分布函数未知，但样本容量足够大时，可以用经验分布函数替代。经验分布函数的定义为：

设 $X_1$ , $X_2$ , …, $X_n$ 为总体分布的一个样本， $-\infty<x<\infty$ ，用 $S (x)$ 表示 $X_1$ , $X_2$ , …, $X_n$ 中不大于 $x$ 的随机变量的个数，则定义经验分布函数为 $F_n(x)$ 为：
$F_n(x)=\frac{1}{n}S(x), \quad -\infty<x<\infty$

当 $n\rightarrow \infty$ 时，可以用经验分布函数 $F_n(x)$ 代替总体分布函数 $F (X)$ 。举例：

在这里插入图片描述

2. bootstrap 方法

经常在 spss 中看到这个方法。当总体分布 $F$ 未知时，但已经有一个容量为 $n$ 的来自 $F$ 的样本，通过对样本再次放回抽样，来估计待估参数 $\theta$ 以及它的置信区间；由于总体分布 $F$ 未知，无法产生模拟样本，也就无法计算 $\theta$ 的估计量 $\hat{\theta}$ ，bootstrap 方法的基本思想就是用 bootstrap 估计量 $\hat{\theta}^\ast_i$ 代替 $\hat{\theta}$ 。

当总体分布已知，对于包含未知参数统计量的置信区间，也可以用 bootstrap 方法。

估计参数值时的一般步骤为：

自原始数据样本 $\textbf{x}=(x_1, x_2, \dots, x_n)$ 按放回抽样的方法，抽得容量为 n 的样本 $\textbf{x}^\ast=(x^\ast_1, x^\ast_2, \dots, x^\ast_n)$ (又称为 bootstrap 样本)。
相继地、独立地求出 $B$ 个 ( $B\geq 1000$ ) 容量为 n 的 bootstrap 样本，计算 $\hat{\theta}^\ast_i=\hat{\theta}(x^\ast_1, x^\ast_2, \dots, x^\ast_n), i=1, 2,\dots, B$ 。 ( $\hat{\theta}^\ast_i$ 称为 $\theta$ 的第 $i$ 个 bootstrap 估计)

估计置信水平为 $1-\alpha$ 置信区间时，在上面两个步骤之外，继续进行下列步骤：

对于每个 bootstrap 样本求出的估计值 $\hat{\theta}^\ast_i$ ，按照从小到大排序：
$\hat{\theta}^\ast_{(1)}\leq \hat{\theta}^\ast_{(2)}\leq\dots\leq \hat{\theta}^\ast_{(B)}$
取 $k_1=\lfloor B\times {\alpha}{2}\rfloor$ ， $k_2=\lceil B\times (1-\frac{\alpha}{2})\rceil$ （分别为向下取整与向上取整），则置信水平为 $1-\alpha$ 的近似置信区间为：
$\hat{\theta}^\ast_{(k_1)}, ~~\hat{\theta}^\ast_{(k_2)})$

具体可以参看浙大概率课本第十章。

心态与习惯

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

心态与习惯

CSDN认证博客专家 CSDN认证企业博客

码龄14年

401: 原创

541: 周排名

814: 总排名

577万+: 访问

: 等级

2万+: 积分

2万+: 粉丝

3622: 获赞

1509: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

最新评论

base-stock 策略的相关证明
媛鸣: 哦哦，这样呀，谢谢老师，感谢您的解答
base-stock 策略的相关证明
心态与习惯: 这里面每个阶段的需求分布可以不一样
base-stock 策略的相关证明
媛鸣: 老师，那您在回复中说您这篇博客介绍的多周期报童模型（Foundations of Stochastic Inventory Theory,2002）是有限阶段非平稳的马尔科夫模型，这里的非平稳态是因为它在N+1周期假设成本构成是-cx,而其他阶段（1,2,...N）成本是由c,ch,cp构成而导致的吗，如果这样理解不对，那是什么原因导致它是有限阶段非平稳的马尔科夫模型呢（我看需求分布每个阶段都是一样的），期待您的回复
base-stock 策略的相关证明
心态与习惯: 你那个文献应该是一个无限阶段的平稳模型，平稳是指不同阶段的随机分布完全一样，再加上各个阶段的成本参数值相同，所以最后各阶段的最优定货策略也完全一样
base-stock 策略的相关证明
媛鸣: 哦哦，感谢老师的回答，是我理解的不到位，老师，我之前看的一些文献是用这本书的continuous time model 建立库存模型的，里面用的是值迭代算法求解出来不同状态（商品库存量）该采取的行动（生产或不生产），文献里用的是，optimal stationary policy，这里的stationary是不是说明这个书的里的continuous time model 是平稳的马尔科夫模型，这个stationary是不是可以理解成策略不随时间变化，只要是在这个状态（库存水平）就采取计算出来的策略呢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

心态与习惯 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。