一、 统计数据的整理与描述
1. 总体与样本
总体:把所要调查研究的事物或现象的全体称为总体
样本:把组成总体的每个元素(成员)称为个体,一个总体中所含的个体的数量称为总体的容量。
2. 统计量:样本的函数,它不依赖于任何未知参数
3. 变异系数:若两组数据的计量单位相同,且均值一样,可以利用标准差比较两组数据的离散程度,但当两组数据的计量单位不同或均值不同时,就不能直接比较两组数据的标准差来分析两组数据的离散程度。
4. 偏度与峭度:是描述统计数据分布偏斜程度的统计量
偏度:
峭度:
5. 累计频数分布
洛伦茨曲线:等次排列,累计数的百分比为横轴,与之对应的收入的累积百分比为纵坐标,所得的曲线。
基尼系数
二、 几种重要的概率分布
1. U,T,X2,F分布
2. 自由度:指可以自由取值的数据的个数,或者指不受任何约束、可自由变动的变量的个数。(矩阵的秩)
三、 多元分布的基本概念
1. 随机向量
2. 分布函数与密度函数
3. 多元变量的独立性
4. 随机向量的数字特征
5.
四、 多元正态分布
1. 若p元随机微量X=(X1,……,Xp)’的概率密度函数为:
五、 参数估计
1. 点估计
2. 区间估计
六、 假设检验
原假设
备则假设
单侧检验 双侧检验
P值:是在零假设成立的情况下,检验统计量的取值等于或超过所观察到的值的概率,从而p值即为否定H0的最低显著性水平。