统计学原理--总论(统计学的对象和方法)基本概念通俗理解

0-统计学

统计学是研究客观现象的统计规律性的科学,是关于数据搜集、整理、归纳和分析的方法论科学。
当然,因为统计学是一门方法论科学,你也可以将里面研究客观现象的统计规律性的方法用于去发现生活中的另类规律性。
比如,当某个随机试验(我们现实生活中做某件事情)做多了,我们就可以发现其中的一些规律性,可以利用这些规律性来帮助我们更好的学习与生活;如何检验你对现实规律性的认知是否正确呢?搞一个假设检验嘛,在假设检验中对于总体分布的假设可以适当的宽松一点,也可以得到你想要的结论。

1-统计学的性质

数量性、总体性和变异性。

  • 为什么要有数量性?
    因为将一些现象出现的情况量化表示之后,就可以自然而然使用数学上的一些方法(集合,加减乘除)计算了。

  • 数量性是什么?
    数量性是用具体的数字来刻画随机现象,用数字来表示随机现象发生的统计规律性(我都会背了哈哈)。

  • 为什么要总体考虑?
    因为其中有一些杂音(噪音,随机误差)会在汇总的过程中被抵消,进而显现出随机现象的统计规律性。(我也理解了,会背了哈哈)。

  • 总体性是什么?
    这也算是从一个非常宏观的角度去研究随机现象的统计规律性。我们可以不在意细节,当然,细节也在汇总整体考虑的时候相互抵消了,我们看不见。

  • 为什么要研究变异性?
    如果我们做一个试验,做一件事情,得到的总是一个结果,不存在变异,那也就没有研究进行试验得到的现象的必要了。就像是必然事件事件一样,在试验之前,不管什么条件,都只可能出现这一结果,那研究只能研究个寂寞!(这里面涉及一个思想,问你说研究变异性,那如果没有变异性可不可以,不可以!所以,以上)。

  • 什么是变异性?
    进行随机试验,会出现不同的结果,这种结果之间的差异,称为变异性。这是比较通俗的说法,那我们规范点,用统计语言来叙述:
    把总体各单位由于随机因素的某一标志表现的差异称为变异。
    标志:是我们对出现结果的属性或者特征的表示;
    表现的差异是:标志的属性的表现形式,即我们能够看到的结果差异。

2-统计学的基本范畴

这是一张网啊,有了此网,你就可以研究(抓住)随机现象的统计规律性,就可以收集、展现出它的规律性。(统计学就是跟规律性、一些结论相结合的嘛!)

统计总体与样本

什么是总体?
总体是我们研究现象的全体,但是通常因为它在数量上过大,无法一一研究。所以我们就只能够研究一部分
接下来就有样本啦,样本就是从总体中抽取的一部分单位,用它来研究总体啦。

总体和样本的关系。
总体是研究对象的全体,而我们有的往往是部分的随机现象(样本,部分),这些是样本。

总体单位与标志

先说的是总体,接着我们引进了单位,那么总体和单位之间有什么关系呢?
当就两者说的时候,总体是有各单位构成。但是总体跟单位的关系往往是相对而言,对于某一个对象,有的时候它是总体,有时候则是单位。比如说,研究某高校各个班级的身高,则每个班级就是一个单位。当研究某一个班级的身高时,该班级的所有同学的身高是总体,而班级每个同学的身高是总体单位。

也就是说,总体单位是构成总体的单位。

标志是反映总体单位属性和特征。就是能够展现出总体单位的特征嘛,比如说研究某高校学生的身高,总体单位则是这个高校,每个学生的身高。
再多举点例子,一个班级的学生,每个学生都有,性别、身高、体重、年龄、籍贯、高考分数、对数学的热爱程度(讨厌、一般、热爱)等不同的标志。

通过上面所举的例子,也可以看见,标志有可以用数来度量和不能用数来度量的标志。能用数来度量的身高、体重、年龄、高考分数,叫做数量标志;不能用数来度量的,性别、籍贯、对数学的热爱程度,叫做品质标志。

之前有讲到统计学的研究对象所具有的性质嘛,有一个很重要的变异性在里面。变异性指的是研究对象的某个特征的变异性。有变异就有不变的。那么对于这里描述总体单位的属性和特征,当然也继承了统计学研究对象所具有的变异性的特点啦。
对应到标志上,就是不变标志和可变标志。
不变标志,是指对于一个总体,各个单位所展现的特征都相同的一个标志。比如说上面所列举的,研究一个班的学生的身高,则这每个人都是学生,所属班级都是这个班,所属大学都是这个大学,再往上就是省、社会、国家、地球、宇宙。(哈哈,我皮了)
可变标志,是指在一个总体中,每个个体可能表现出不同的标志称为不变标志。比如,性别、身高、体重巴拉巴拉。

那么我们上升一下,研究不变标志和可变标志的意义是什么呢?这个要宏观一点,对应到统计学上来。不变标志,是都要有的,有的这个标志我们才能够汇聚到一起,可变标志,也是要有的,有了它,也才有了研究这个总体的意义。
对应到集合想想看,一个集合的定义是说,把具有某种特征或满足一定性质的所有对象或事物始为一个整体时,这个整体就称为集合。
能够把大家拉到一起的是这个不变标志,让大家都独一无二的缘故是这里面存在的可变标志。

标志与指标的关系

标志是研究的总体单位,表明总体单位的属性和特征。
指标的研究对象是统计总体,表明总体的数量特征。

统计指标与指标体系

统计指标

统计指标相当于是将标志综合起来考虑了,由此来考虑研究总体的数量特征和数量特性。
比如说,还是拿前面某个班级作为研究对象来说,一个班级的人数,山东人的总数、男女比例、对数学极其热爱比例、数学分析的平均成绩等等,这都是代表一个班级总体的统计指标。
其中,班级的人数、山东人的总数,是代表班级总体的数量指标。
男女比例、对数学极其热爱比例、数学分析的平均成绩是班级总体的质量指标。

来给出一个抽象化的定义:
统计指标是反映总体数量特征的概念和取值。也即有两个要素,一个是指标的概念,另一个是指标的取值。
统计指标又分为数量指标和质量指标。
数量指标反映现象的总规模、总水平和工作总量的统计指标。一般用绝对数来表示。
质量指标是反映现象相对水平和工作质量的统计指标。一般用相对数平均数来表示。

指标体系

以上的标志和指标都是用来研究某个现象的某一方面的特征,比如班级的数学分析成绩的平均数。但是很多时候我们需要综合考虑,既想要考虑数学分析的平均成绩,又想考虑成绩的波动情况(方差),研究成绩达优秀以上的比例等等。
多个特征,综合考虑,也就是说将这些错综复杂,具有多方面练习的客观现象综合到一起考虑。就又了指标体系的概念。

统计指标体系,是由一系列相互联系的统计指标所组成的有机整体。

举例子,考察一个班级的综合素质,则不仅需要考虑学习成绩,还需考虑一些课外实践的成绩、与人交往的评价,来综合评判一个人,而不是就某个单一的指标来评价一个人。如果使用单一指标,则会导致评价太过片面,对一个学习成绩一般但是实践能力很强、人缘很好的学生来讲不公平。

3-统计学的方法

大数定律

提及到统计学,数据。根据我们一般的经验,当试验多次重复进行了,我们就可以“自然”地发现某些现象发生的规律。这里的多次,对应的数据的多次累积,多次统计。那么,刚才的解释就可以对应到数据科学中的大数定律来。以大数定律为基础,来以多少的保证程度来推断某些数量特征,或者你说是某种规律也可以。

以上是引入,那么开始讲一讲,什么是大数定律。

大数定律,是说明明大量的随机现象的平均结果具有稳定性的法则。说明量大,以平均数稳定性的这种形式展现出的规律。

意义(为什么要研究它):

  1. 总体的某种总体规律只有当具有这些现象的足够多束的单位汇总综合在一起时,才能够展现出它的统计规律性。
  2. 现象的总体性规律,通常是以平均数的形式展现出来。
  3. 所研究的总体,包含的单位愈多,越能够展现其统计规律性(说明我们越能够相信自己推断认识得到的统计规律性。
  4. 总体的共同倾向决定着平均数的水平,而单位的离差则由于足够多的单位数的现象汇总,而被抵消,趋于消失。

统计学的研究方法

统计学是关于数据搜集、整理、归纳、分析的方法论科学。

方法就是,如何搜集、整理、归纳、分析数据。

我获取对某一现象的认识,一般意义上讲,是搞个试验,亲自试试会出现什么结果,然后整理出现的数据,利用一些方法来分析数据,进而认知规律。

刚是我随口说的,对应到统计学的术语来,则是实验设计,大量观察、统计描述、统计推断

实验设计,是指设计合理的实验,使得收集得到的数据符合统计分析的要求。

大量观察,只能观察了,我们不能够实际去进行这项试验或者说不能够重复进行试验咋办?去问别人,收集数据。普查,抽样调查、重点调查、典型调查等等都是大量观察的组织形式。

统计描述,则是将我们的数据搞整齐(站好,有序),帮助我们进行下一步的分析。也就是对试验或调查得到的数据进行登记、审核、整理、归类、计算出能够反映总体数量特征的综合指标,并加以分析从中抽出有用的信息,用表格或者图像把它表示出来。

刚才讲到这三种方法都是比较客观地收集数据,实际是怎么样的,记录下来就是什么样的。下面就要在这些数据的基础上,去用一些数学方法,“人为”地推出一些原本没有的东西/特征。

统计推断,用以上得到的数据(一般是部分、有限),进行分析,推断总体的数量特征(规律性)。利用这些数据,以一定的可信度,用样本数据(试验或者调查得到的)来土断总体的数量特征的归纳推理的方法。
主要有两种:参数估计和假设检验。参数估计,是一直总体的分布,但是不知道总体的分布的某个参数,于是就用样本的估计参数来推断总体的参数。假设检验,是对总体的数量特征作出假设(均值、方差、分布)作出假设,用一定的概率保证程度来推断总体。

完啦,这就是统计学的总论,一些基本概念啦。
其实开始有好多不懂的,感觉太抽象的东西,尝试着去写、去类比,慢慢就可以具象化,就可以理解啦。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值