1、统计学定义
统计学是一门收集、处理、分析、解释数据,并从数据中得出结论的科学。
数据分析的方法有2种:
- 描述性统计方法:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;
- 推断性统计方法:研究的是如何通过样本数据推断总体特征。
2、统计数据分类
「截面数据」:在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间中获得的;例如:2010年我国各地区的国内生产总值。
3、总体和样本
3.1 总体
包含所研究的全部个体(数据)的集合。
总体分为有限总体和无限总体,主要是为了判别在抽样中每次抽取是否独立:
(1)无限总体每次抽取一个单位并不影响下一次抽样,因此每次抽取可以看作是独立的;
(2)有限总体每抽取一个单位,总体元素就会减少一个,前一次的抽样结果往往会影响第二次的抽样结果,因此每次抽取是不独立的。
3.2 样本
从总体中抽取的一部分元素的集合。
4、参数和统计量
4.1 参数
- 描述总体特征;
- 因为总体数据通常是不知道的,所以参数是一个未知的常数(注意:是一个常数,即是一个定值)。
4.2 统计量
- 描述样本特征;
- 因为样本数据是已经抽取出来的,所以统计量总是知道的;
- 由于抽样是随机的,因此统计量是样本的函数。
抽样的目的就是要根据样本统计量去估计总体参数。
参考资料
[1] 贾俊平. (2018). 统计学 (第7版). 中国人民大学出版社.