北京大学任艳霞老师概率统计(A) 统计学部分总结 (一) 基本概念

最新推荐文章于 2021-07-20 11:36:11 发布

crkPkuPhy

最新推荐文章于 2021-07-20 11:36:11 发布

阅读量553

点赞数

分类专栏：概统文章标签：统计学

本文链接：https://blog.csdn.net/qq_42969704/article/details/104014143

版权

概统专栏收录该内容

2 篇文章 0 订阅

订阅专栏

概率统计整理[统计学部分] 基本概念

若干基本概念

若干基本概念

我打算首先花一部分篇幅讨论基本概念,其目的在于,这样可以对整个统计学的思想和方法有一个更全面的认识.只希望了解其中具体方法的读者,可以跳过这一部分.

数据与随机变量

统计学的研究对象是数据,核心任务是对数据进行分析,进而对所考察的问题作出推断.

以考察电子产品使用寿命为例.测得5台产品寿命数据如下:

17	20	50	50	50

数据即为表中的寿命数据,一切研究都是从得到的这些信息出发的.
用数学语言来表达的话,我们计作数据 $\vec{x} = (x_1,x_2,...,x_n)$

由经验,我们知道使用寿命有一定的随机性.为了精确的表述这种随机性,我们引入随机变量 $X$ ,描述使用寿命的分布.

那么随机变量与数据的关系是什么呢?

$x_1$ 是 $X$ 的一个观察值,也可看作与 $X$ 同分布的随机变量 $X_1$ 的观察值.同样的, $\vec{x} = (x_1,x_2,...,x_n)$ 可看作 $\vec{X} = (X_1,X_2,...,X_n)$ 的观察值.而我们一般要做的就是由观察值推测随机变量本身的性质.

随机变量的分布

总体:考察的对象的总和,一般为随机变量.

总体分布:想要考察的总体的分布.

由于我们不知道总体的分布,我们不得不将总体分布看成分布类中的一个成员,这自然而然的引入了参数的概念.

若总体服从指数分布,分布密度具有如下形式:
$p(x,\theta) = \frac{1}{\theta}e^{-\frac{x}{\theta}},x>0,\theta>0$
则 $\theta$ 为参数,相应的 $F(x,\theta)$ 为分布函数.

模型

$F(x,\theta)$ 或 $\theta$ 是未知的,我们只能确定一个分布族,用 $\mathscr{F} = \{F_\theta : \theta \in \Theta \}$ 表示,其中 $\Theta$ 表示参数取值的空间,即参数空间.

有了随机变量 $X$ 和分布族 $\mathscr{F}$ 就形成了一个模型.

样本

之前提到过,数据 $\vec{x} = (x_1,x_2,...,x_n)$ 可以看作是 $\vec{X} = (X_1,X_2,...,X_n)$ 的一组观察值(其中 $X_1,X_2,...,X_n \sim iid F_\theta$ ).
称 $\vec{X} = (X_1,X_2,...,X_n)$ 为样本,n为样本量, $\vec{x} = (x_1,x_2,...,x_n)$ 为样本值. $\vec{X}$ 所有可能取值的集合 $\mathscr{X}$ 称为样本空间.

统计量

定义在 $\mathscr{X}$ 上的任何函数 $T(\vec{x})$ 称为统计量,它是只依赖数据的函数.

在我看来,引入统计量的意义在于,我们所能实际获取的只有数据,因此我们在研究中就只能通过数据来表达我们关心的量,比如参数的估计值,总体的性质(如均值,方差)

举一个常用来估计均值的统计量,以助于理解统计量这个概念.

$\hat{a} = \frac{1}{n} \Sigma^n_{i=1}X_i$

crkPkuPhy

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
北京大学任艳霞老师概率统计(A) 统计学部分总结 (一) 基本概念

概率统计整理[统计学部分]若干基本概念数据与随机变量随机变量的分布模型样本统计量估计最大似然估计矩估计估计的无偏性与优良性UMVUE与指数族分布相合性与渐进分布置信区间与置信限枢轴量正态情形μ\muμ已知σ2\sigma^2σ2未知σ2\sigma^2σ2σ2\sigma^2σ2假设检验功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你...
复制链接

扫一扫