绪论
什么是统计学?
根据《兰登书屋大学字典》 (The Random House College Dictionary)定义,统计学是“对用数字表示事实或数据进行收集、分类、分析以及解释的科学”。概括来说,统计学就是数据的科学。
什么是R?
R是进行统计分析、给图以及统计编程的平台,是进行统计分析的重要工具,是现今最受欢迎的数据分析和可视化软件。
统计学的基本要素
1.总体与样本
- 总体(population):称研究对象的全体,通常用一个随机变量(例如X)表示总体。
- 个体(individual):组成总体的每个基本单元 。
- 抽样:从总体X中随机抽取一部分个体X1,…Xn,称X1,…,Xn为取自总体X的样本容量(sample size)为n的样本。
- 样本(sample): 若X1,…,Xn相互独立,且每个Xi与X同分布,则称X1,…,Xn为简单随机样本(simple random sample),简称样本。
2.参数与统计量
- 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征。
- 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的量。
易混点:样本是随机的,因此,统计量是样本的函数,而不是一个统计量。