目录
1. 总体与样本
数理统计学是一门以数据为基础的学科.
数理统计学的任务就是如何获得样本和利用样本,从而对事物的某些未知方面进行分析、推断并作出一定的决策。
例如:生产厂家声称他们生产的灯泡平均寿命不低于6000小时,如何验证厂家说法的真伪?由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡进行检验,通过这部分灯泡的寿命数据来推断整批灯泡的平均寿命。
以部分数据信息来推断整体未知参数,就是数理统计研究问题的基本方式。
1)总体:研究对象的全体
2)个体:总体中的成员
3)总体的容量:总体中包含的个体数
4)有限总体:容量有限的总体
5)无限总体:容量无限的总体,通常将容量非常大的有限总体也按无限总体处理。
- 例子
1)了解某校大学生“做过家教(包括 正在做家教)”的比例。总体是该校大学生全体。这是一个有限总体,每个大学生有许多指标,比如性别, 年龄,身高,体重,高考成绩...。现在我们关心的是学生是否“做过家教”这一指标。
2)了解某城市的空气质量情况,关注该城市的PM2.5值。总体是城市上空一定范围内的空气,这是一个无限总体,描述空气质量有许多指标,而我们仅关心PM2.5值。
3)药厂研究某种药物在人体中的吸收情况。 总体是全体国民,这是一个有限总体,但数量非常巨大,我们常把它看成无限总体。
为了采用数理统计方法进行分析,首先要收集数据,数据收集方法一般有两种:
1)通过调查、记录收集数据。如为了调查大学生是否“做过家教”,可以进行问卷调查;要了解PM2.5值,需要在城市设立若干监测站点,定时收集PM2.5数据。
2)通过实验收集数据。如为了了解药物吸收情况,首先要进行试验设计,并征集若干志愿者,按试验设计方案将他们分成若干组, 监测他们服药后不同时间点身体中药物含量, 记录相应的数据。
1)实际中人们通常只关注总体的某个(或几个) 指标。
2)总体的某个指标X, 对于不同的个体来说有不同的取值, 这些取值构成一个分布, 因此X可以看成一个随机变量.
3)有时候直接将X称为总体. 假设X的分布函数为F(x), 也称总体X具有分布F(x).
- 如何推断总体分布的未知参数(或分布)?
需要从总体中抽取一部分个体, 根据这部分个体的数据,并利用概率论的知识等作出分析推断.
被抽取的部分个体叫做总体的一个样本.
- 简单随机样本