数理统计学的基本概念

最新推荐文章于 2024-07-04 21:38:47 发布

jk大懒猫

最新推荐文章于 2024-07-04 21:38:47 发布

阅读量2.7k

点赞数

分类专栏：数学机器学习文章标签：概率论数理统计

本文链接：https://blog.csdn.net/u012074597/article/details/79713498

版权

数理统计学利用概率论和数学方法研究数据收集、分析和推断。总体是指具有相同概率分布的个体集合，样本是从总体中随机抽取的部分个体。统计量是仅依赖样本的量，如样本均值，用于估计未知参数。样本矩，如原点矩和中心矩，是重要的统计量，用于反映数据分布特性。

摘要由CSDN通过智能技术生成

什么是数理统计学

当我们用实验或观察的方法研究一个问题时，首先要通过适当的观察或实验取得必要的数据，然后就是对所得数据进行分析，以对所提问题作出尽可能正确的结论。为什么说“尽可能正确”呢？因为数据一般总是带有随机性的误差。 需要指出的是，这里的误差，不是通常意义上的因测量不准而导致的误差，这里所说的误差，主要指的是由于观察和实验的样本只能是总体的一部分，而究竟是那一部分则是随机的。例如一个学校有上万名学生，你从中抽出50人来研究该校学生的学习情况，抽取的结果（那50人）不同，所得数据就不同，这完全凭机会而定。我们说的随机误差主要是指这个，由于数据带有这样的随机性，通过分析这些数据而做出的结论，也就难保其不出错了。分析方法的要旨，就在于是可能产生的错误越小越好，发生错误的机会越小越好，这就需要概率论的工具。初步可以看出概率论和数理统计学的密切关系。

数理统计学使用概率论和数学的方法，研究怎样收集（通过实验或观察）带有随机误差的数据，并在设定的模型（称为统计模型）之下，对这种数据进行分析（称统计分析），以对所研究的问题作出推断（称为统计推断）。

总体

总体是指与所研究的问题有关的对象（个体）的全体所构成的集合。比如要研究某大学学生的学习情况，则该校的全体学生构成问题的总体。对于大多数实际问题，总体中的个体是一些实在的人或物，而问题中所注意的，并不在于这些人或物本身，而在于所关心的某种指标。例如一个学生有身高、体重、籍贯、出身等等特征，当我们研究学生的学习成绩时，对这些都不关心，而只注意其考分如何。这样，也可以把我们感兴趣的那个指标值作为该个体，而总体就由一些数所组成。

单是这样还不行，这里有两个问题：一是总体中这样一大堆杂乱无章的数没有赋予什么数学或概率的性质，因而无法使用有力的概率论工具去研究它；二是各种总体变得没有区别。解决这些问题的途径，就涉及总体这个概念的核心——总体的概率分布。

数理统计学中总体这个概念的要旨——总体就是概率分布。当总体分布为指数分布时，称为指数分布总体；当总体为正态分布时，称为正态分布总体，或简称正态总体。两个总体，即使其所含个体的性质根本不同，只要有相同的概率分布，则在数理统计学上就视为同类总体。例如人的寿命也可以服从指数分布，与元件寿命的分布一样，处理二者的统计问题的方法也一样，即可视为同一类总体。

对以上所说要做一点说明：比如我们假定了元件的寿命服从指数分布，但并没有指定其中参数 $\lambda$ 的值， $\lambda$ 可取0到正无穷内任何值，故更正确地应当说：总体分布是一个概率分布族的一员。这个分布族包含了一个参数 $\lambda$ ，称为单参数分布族。而正态分布族 $N(\mu,\delta^2)$ 包含两个参数， $\mu$ ， $\delta$ ，是一个两参数分布族。

样本

样本是按一定的规定从总体中抽出的一部分个体。所谓“按一定的规定”，就是指总体中的每一个个体有同等的被抽出的机会。由于我们感兴趣样本的某一特征指标值，所得样本表现为若干个数据 $X_1,\cdots,X_n$ ，n称为“样本大小”或“样本容量”。

在一个具体问题中，样本 $X_1,\cdots,X_n$ 是一些具体的数据。而在理论的研究上，则要把它看成一些随机变量。因为筹到哪一些个体是随机的，因而其指标值，即 $X_1,\cdots,X_n$ 也是随机的。

一般我们设想，从总体中抽取一个或n个样本，对总体的分布影响极少或毫无影响。这时 $X_1,\cdots,X_n$ 独立且有相同的分布，其公共分布即总体分布。

统计量

完全由样本所决定的量叫做统计量。这里要注意的是“完全”这两字，它表明：统计量只依赖于样本，而不能依赖于任何其他未知的量。特别是，它不能依赖于总体分布中所包含的未知参数。

例如，设

最低0.47元/天解锁文章

jk大懒猫

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
数理统计学的基本概念

什么是数理统计学当我们用实验或观察的方法研究一个问题时，首先要通过适当的观察或实验取得必要的数据，然后就是对所得数据进行分析，以对所提问题作出尽可能正确的结论。为什么说“尽可能正确”呢？因为数据一般总是带有随机性的误差。需要指出的是，这里的误差，不是通常意义上的因测量不准而导致的误差，这里所说的误差，主要指的是由于观察和实验的样本只能是总体的一部分，而究竟是那一部分则是随机的。例如一个学校有...
复制链接

扫一扫

专栏目录