概率到统计的思考与理解

38 篇文章 2 订阅
13 篇文章 0 订阅

由于统计学在现实生活和“高端”科学研究中有着很高的地位,时常思考统计相关的问题,加深对它的基础理论的理解应该对我们理解和研究现实世界有帮助。

1、样本空间与总体的关系

样本空间,在茆诗松等编著的《概率论与数理统计教程》一书中,是这样定义的:随机现象一切可能基本结果组成的集合称为样本空间,每个基本结果被称为样本点。首先理解一下,什么是随机现象?随机现象就是在一定条件下,并不总是出现相同结果的现象,称为随机现象。这里我们不去深究什么是现象,因为他的解释本身是抽象的,抽象的东西相对具体的东西理解稍微困难一点,我们可以在不断的学习过程中慢慢理解、意会这些概念。这里我们固定了某个关心的结果后,就可以产生样本空间了。比如,我们研究“某个环境中,固定条件下,投掷骰子出现的点数”,这里我们考虑的是出现的点数这种结果形式,为什么不是说结果,而是说结果形式,只是微妙的一点点差别而已,结果是确定的,而结果形式是概述这些可能的结果,我这样理解,但是由于这样会带来理解上的负担,干脆用“结果”这个词来代替了,在大多数情况下,大家都可以意会。这个例子中,我们考虑的是投掷骰子这种随机现象的出现点数这种结果,所以样本点有“出现1点”,“出现2点”,...,"出现6点",这些样本点组成样本空间。样本空间还强调了“一切可能”,表征全面性。样本空间的本质属性是集合,这个定义不想我们大家在代数中学到的空间一样,代数中,空间是定义了运算以及某些限定条件的集合,他跟分析中的空间也不一样,总之概率中的样本空间仅仅是一个集合而已,如果你愿意,你可以叫他样本集合。

总体,我们继续把茆诗松等人的定义作为理解的出发点,所谓总体就是指研究对象的全体。与样本空间不同,样本空间是随机现象的我们所关心的结果的集合,而总体是指对象的全体,它本质也是集合的概念,每个研究对象是可以区分开来的,每一个对象我们称之为个体,总体只说明是对象的集合,没有说明是结果的集合,但是很多情况下,或者研究统计的科学家实际上是想把总体定义成结果的集合的,实际中他们也是这样用的。他们隶属的学科也不同,样本空间属于概率论的范畴,总体属于统计的范畴。概率是给出某些假设本质,研究本质后的现象问题,就是说概率是已知概率分布,然后研究随机变量的关系啊,性质啊,给一些新的变量定义啊,比如数学期望,方差,标准差啊之类的,统计是为了发现总体某种原始本质性质,而做出的数学上的分析和理解。当然这只是我个人的理解,也许事实不是这样的,不管事实怎样,这样理解并不会对我们理解统计学的基本原理和方法造成障碍。

既然学科不同,即使他们有联系,我们在考虑不同学科的时候,根据上下文区分即可,不要过于纠结,纠结多了,会阻止我们前进的。


2、理解总体之后的概念和需要研究的问题

知道了什么是总体,什么是个体了么? 如果我们要研究某个区域中学生的身高,那么这个区域中所有学生的身高构成了我们研究问题的总体,每个学生的身高就是一个个体。这样一来,我们如果继续思考下,写书的作者也做过讨论,就是做数学理论研究,很容易想到去除实际背景,研究去除背景后的数学模型的性质理论。这里呢,我们就去除身高这个实际名词,我们研究的是代表身高的那一堆数,这堆数有的出现的次数多一点,有的出现的次数少一点,也就是说在这堆数中任意取一个数,每个数都有可能被抽到。那么我们可以把这个数看成随机变量去研究它,是可以的,这堆数有用一个分布函数来描述它,每个数用随机变量描述它。再插一点,什么是随机变量呢?随机变量是定义在样本空间上的一个实值函数。又提到样本空间了,另一种理解,样本空间就是这个区域中所有学生,样本点就是每个学生,那么不管你研究身高,还是体重,这两个都可以给出数量指标,这个指标完全可以用实数来表示,这就是随机变量了,如果考虑的是身高和体重,用一个二维随机变量来表示就行了。现在我们研究的是统计学问题,随机变量就是定义在总体之上的实值函数,但是前面我们说的总体是全体学生的身高啊,怎么不是全体学生呢?哈哈,可以根据上下文区分下,总体到底是什么,一般我们研究的是可以量化的指标,如果只考虑某一个指标的时候,我们研究的每个同学只有一个这样的指标,所以这个指标可以认为就是这个同学了,但是我们在研究多个指标的情况下,我们只能把总体看成是全体学生了,你不把它看成全体学生也可以,可以认为每个个体只是变成了一个多维描述的指标了而已。

在纠正道正路上来,我们研究总体的性质有很多限制,比如我们没有那么多人力去认真统计某个大区域中的所有学生身高。我们又想知道总体到底是一个什么样子的。其实我们说研究性质,不是十分准确,概率统计中,只要分布已知了,本质就知道了。所以准确的说,我们是为了研究总体的分布,想知道总体到底满足什么分布,然后某些分布具有什么性质,就是概率论研究的内容了。

不能每个个体都研究,我们就想一个办法来近似的研究整体,就是找一个我们认为能很好的代替总体的一个小集合来研究下,为了更好的在数学上研究呢,我们就引进了样本的概念。关于样本的定义大家有一点差别,但是不会影响我们后面的学习,我倾向于于寅写的高等工程数学里的理解,当然他也许不是这个定义的创造者,但是我读了他的书,学知识而已,就认为是他写的也不会影响我们最终的收获。样本就是按照一定规则从总体抽取的若干个体,抽取的个体数目称为样本容量,有的人也就他样本量。如果我们抽取的规则是随机的,也就是说每个个体被抽到的机会是均等的;每一次抽取的个体跟其它次抽取行为没有关系。这样的到的样本叫简单随机样本。我们大多数情况下研究这样的样本。因为这样的样本才能很好的反应总体的本质。至于为什么这样的样本能反应总体分布,我没有去证明,也许有前辈已经证明了,我们就可以站在前辈的肩膀上了。

想想,既然从总体中是随机拿到的一个值,那么代表这个值得变量就是随机变量了,它应该跟总体满足相同的分布,而且他们相互独立,所谓独立同分布啊。所以一个样本可以认为是一个多维随机变量,每一维都是独立的。试验做毕,你会得到一组值,这组值就是样本观测值。试验就是抽取个体的过程。样本中的每个个体呢,也有个新名字,叫样品。有的时候也不区分这个,所以有些书里面也就不介绍了。




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值