基本概念
一、总体、单位和样本
总体:统计学解决任何一个问题都有待认识的客观事物的全体;
单位:是组成总体的各个个体;
样本:总体的部分单位组成的集合
二、标志、指标、参数和统计量
标志按其表现分为品质标志和数量标志:
品质标志:表明单位属性方面的特征,而且其表现只能用非数值来描述。例如每个人的性别。、
数量标志:表示单位数量方面的特征,其表现用数值来描述。例如每个人的收入。
统计总体具有的数量特征及其数值成为统计指标。(它是由指标的概念和指标的取值两项基本要素构成)
指标按其表示形式可以分为数量指标和质量指标:
凡是反映现象总规模、总水平的统计指标称为数量指标。
凡是反映现象相对水平和工作质量的统计指标称为质量指标。(质量指标是数量指标的派生指标,用相对数和平均数来表示,以反映现象之间的内在联系和对比关系)
参数:是用来描述总体分布特征的数值,通常未知,但是是唯一的。(通常有总体平均数、总体方差和总体比率)
统计量:是指样本的特征。是样本观测量的一个已知函数。
三、数据
1、变量与变量值
变量:即将标志、指标和统计量名称进行归纳得来。也就是说明客观现象的某一特征。
变量值;即变量的具体表现。
数据集的定义:将在特定研究过程中收集的所有数据集合在一起;
根据变量值的确定与否,将变量分为确定性变量和随机变量。
2、数据的计量尺度
A、定类尺度:说明客观现象无序类别的计量。
B、定序尺度:说明客观现象有序类别的非数值计量。
C、定量尺度:说明客观现象数值间距有意义的计量。
定类尺度的数据成为定类数据,定序尺度的数据成为定序数据,统称为定性数据,定量尺度的数据成为定量数据。
定性变量是指带有定型数据的变量,定量变量是指戴欧定量数据的变量。
定量变量分为连续型变量和离散型变量。
3、数据的类型
根据客观现象的时间状况的不同,统计数据可分为:横截面数据、时间序列数据和面板数据。
横截面数据:又指静态数据,它是指在同一时间对同一总体内不同单位进行观察而获得的数据。例如2014年全国各省、市、自治区居民收入总值就属于横截面数据。
时间序列化数据:又称为动态数据。它是指在某一段时间内按时间顺序对同一总体内不同单位进行观察而获得的数据。例如“十二五”期间我国按年份顺序的居民收入总值。
面板数据:指的是同时在时间和截面空间上取得的二维数据