目录
第二章 统计数据的收集、整理与显示
一些概念
洛伦茨曲线图
Lorenz博士把累计频数(或频率)分布曲线用于研究社会财富、土地或收入的分配是否公平,这种累计曲线又称洛伦茨曲线。
绘制方法:
以人口和收入为例,将两列数据先转化成百分比,(例如某项人口占总人口的百分之多少),再进行累计,将两列累计百分比的点标出坐标,再用平滑的曲线连接。
基尼系数
Gini在洛伦茨曲线图基础上进一步提出一个衡量收入分配公平程度的指标——基尼系数,基尼系数就是实际收入分配曲线与绝对平等线包围的面积与总的三角形面积之比,基尼系数越小,代表分配越公平。国际通行标准是<0.2:收入分配高度平均,0.2-0.3相对平均,0.3-0.4大致合理,0.4-0.6差距偏大,>0.6严重不公。
左偏及右偏
偏度是描述分布“偏离对称性程度”的特征数,注意是“偏离”而不是“偏向”,也就是说这里的偏是“离开”的意思,所以左偏是指离开了左边,右偏是离开了右边。因此,如果峰值在对称轴左边,则是右偏(正偏)。
思考题
全面调查是否一定比抽样调查更准确可靠
二者都存在登记性误差,除此以外,抽样调查还存在代表性误差及推算误差。但如果全面调查基数过大而登记人员由于培训不够等原因,反而会比经过专业训练的人员调查的部分单位的登记性误差还大,所以并不能说全面调查就比抽样调查可靠。
统计分组的要求
满足穷尽原则和互斥原则
第三章 数据分布特征的描述
测度数据集中趋势的指标
分为两大类:数值平均数和位置代表值
【数值平均数】
算术平均数:求和再除以项数
加权平均数:当各变量权数完全相等时,加权平均数就变成了算术平均数
调和平均数、几何平均数
测度数据离散程度的指标
极差:最大值与最小值之差
四分位差:第3四分位数与第1四分位数之差
标准化值:来自不同均值和标准差的个体数据往往不能直接对比,需要对数据进行标准化,标准化值一般用Z表示,
excel实现描述统计
①调出excel中的数据分析功能:更多-选项-加载项-转到-分析工具库
分析:数据-数据分析-描述统计