CDA数据分析师 出品
统计指标按照其反映的内容或其数值表现形式可以分为总量指标、相对指标、平均指标、变异指标。按其所反映总体现象的数量特性的性质不同可分为数量指标和质量指标。
一、总量指标
总量指标是反映社会经济现象发展的总规模、总水平的综合指标。即数量指标,也称为绝对数。例如国内生产总值**、**人口总数、粮食总产量等。
1、按反映的时间状况不同分为时期指标和时点指标
时期指标:表明现象总体在一段时期内发展过程的总量。它具有可加性、数值大小与时期长短有直接关系、需要连续登记汇总。例如,在某一段时期内的出生人数、死亡人数等。
时点指标:表明现象总体在某一时刻(瞬间)的数量状况。它不具有可加性、数值大小与时期长短没有直接关系、由一次性登记调查得到。例如,在某一时点的总人口数。
2、按反映的总体内容不同分为总体单位总量和总体标志总量
总体单位总量:总体所包含的总体单位的数量。
总体标志总量:总体单位在某一数量标志上的标志值的总和。
只有可加总体能够计算总体单位总量,不可加总体没有总体单位总量;一个总体中只有一个单位总量,但可以有多个标志总量,它们由总体单位的数量标志值汇总而来。
3、按计量单位不同可分为实物指标、劳动指标和价值指标
二、相对指标
相对指标又称统计相对数,它是两个有相互联系的现象数量的比率,用以反映现象的发展程度、结构、强度,普遍程度或比例关系 。把两个具体数值抽象化,使人们对现象之间所存在的固有联系有较为深刻的认识,相对指标在社会经济领域广泛存在,借助于相对指标对现象进行对比分析,是统计分析的基本方法。
1、结构相对数
它是在资料分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。例如,恩格尔系数。公式如下:
结
构
相
对
数
=
总
体
部
分
数
值
总
体
全
部
数
值
∗
100
%
恩
格
尔
系
数
=
消
费
支
出
中
用
于
食
品
的
支
出
全
部
消
费
支
出
∗
100
%
结构相对数=\frac{总体部分数值}{总体全部数值} \ast 100 \% \\ 恩格尔系数=\frac{消费支出中用于食品的支出}{全部消费支出} \ast 100 \%
结构相对数=总体全部数值总体部分数值∗100%恩格尔系数=全部消费支出消费支出中用于食品的支出∗100%
用来分析现象总体的内部构成状况。
2、比例相对指标
它是总体中不同部分数量之比的相对指标,用以分析总体范围内各个局部、各个分组之间的比例关系和协调平衡状况。
比
例
相
对
数
=
总
体
中
某
一
部
分
数
值
总
体
中
另
一
部
分
数
值
∗
100
%
比例相对数=\frac{总体中某一部分数值}{总体中另一部分数值} \ast 100 \%
比例相对数=总体中另一部分数值总体中某一部分数值∗100%
用来反映组与组之间的联系程度或比例关系。
3、比较相对指标
它是不同总体或单位的同类现象数量对比而确定的相对指标,用以说明某一同类现象在同一时间内各单位发展的不平衡程度,以表明同类事物在不同条件下的数量对比关系。
比
较
相
对
数
=
某
总
体
或
单
位
的
某
一
指
标
另
一
总
体
或
单
位
的
同
一
指
标
∗
100
%
比较相对数=\frac{某总体或单位的某一指标}{另一总体或单位的同一指标} \ast 100 \%
比较相对数=另一总体或单位的同一指标某总体或单位的某一指标∗100%
用来说明现象发展的不均衡程度。
4、强度相对数
它是两个性质不同而有联系的总量指标之间的对比,用来表明某一现象在另一现象中发展的强度、密度和普遍程度。
强
度
相
对
数
=
某
一
总
量
指
标
数
值
另
一
有
联
系
但
性
质
不
同
的
总
量
指
标
数
值
∗
100
%
强度相对数=\frac{某一总量指标数值}{另一有联系但性质不同的总量指标数值} \ast 100 \%
强度相对数=另一有联系但性质不同的总量指标数值某一总量指标数值∗100%
不是同类现象指标的对比。
5、动态相对数
它又称***发展速度***,表示同类事物的水平报告期(被研究的时期又称本期、计算期)与基期(作为比较基准的时期)对比发展变化的程度。
发
展
速
度
=
报
告
期
指
标
数
值
基
期
指
标
数
值
∗
100
%
发展速度=\frac{报告期指标数值}{基期指标数值} \ast 100 \%
发展速度=基期指标数值报告期指标数值∗100%
用来反映现象的数量在时间上的变动程度。
6、计划完成程度相对数
用来检查、监督计划执行情况,它以现象在某一段时间内的实际完成数与计划任务数对比,借以观察计划完成程度。
计
划
完
成
程
度
相
对
数
=
实
际
完
成
数
计
划
完
成
数
∗
100
%
计划完成程度相对数=\frac{实际完成数}{计划完成数} \ast 100 \%
计划完成程度相对数=计划完成数实际完成数∗100%
在上述公式中,分子是根据实际完成情况进行统计而得的数据,分母是下达的计划指标,公式中的分子和分母数值表明计划执行的绝对效果。
对短期计划完成情况来说,考察计划执行进度情况的公式为:
计
划
完
成
进
度
=
累
计
至
本
期
止
实
际
完
成
数
全
期
计
划
任
务
数
∗
100
%
计划完成进度=\frac{累计至本期止实际完成数}{全期计划任务数} \ast 100 \%
计划完成进度=全期计划任务数累计至本期止实际完成数∗100%
对长期计划完成情况的检查,有两种方法,分别是累计法和水平法。累计法是指计划指标按计划期内各年的总和规定任务,公式如下:
计
划
完
成
程
度
=
计
划
期
内
实
际
完
成
累
计
数
计
划
任
务
总
数
∗
100
%
提
前
完
成
计
划
时
间
=
计
划
全
部
时
间
−
自
计
划
执
行
日
起
至
累
计
实
际
数
量
已
达
到
计
划
任
务
数
所
需
要
的
时
间
计划完成程度=\frac{计划期内实际完成累计数}{计划任务总数} \ast 100 \%\\ 提前完成计划时间=计划全部时间-自计划执行日起至累计实际数量已达到计划任务数所需要的时间
计划完成程度=计划任务总数计划期内实际完成累计数∗100%提前完成计划时间=计划全部时间−自计划执行日起至累计实际数量已达到计划任务数所需要的时间
水平法是指计划指标以计划末期应达到的水平规定。
计
划
完
成
程
度
=
计
划
末
期
实
际
达
到
的
水
平
计
划
规
定
末
期
应
达
到
的
水
平
∗
100
%
提
前
完
成
计
划
时
间
=
计
划
全
部
时
间
−
出
现
连
续
12
个
月
的
实
际
完
成
数
达
到
计
划
任
务
数
所
需
要
的
时
间
计划完成程度=\frac{计划末期实际达到的水平}{计划规定末期应达到的水平} \ast 100 \%\\ 提前完成计划时间=计划全部时间-出现连续12个月的实际完成数达到计划任务数所需要的时间
计划完成程度=计划规定末期应达到的水平计划末期实际达到的水平∗100%提前完成计划时间=计划全部时间−出现连续12个月的实际完成数达到计划任务数所需要的时间
三、平均指标
平均指标是用以反映社会经济现象总体某一数量标志在一定时间、地点条件下所达到的一般水平的相对指标。平均指标的种类有:算术平均数、调和平均数、几何平均数、众数和中位数。前三种平均数是根据总体所有标志值计算的所以称为数值平均数,后两种平均数是根据标志值所处的位置确定的,因此称为位置平均数。在一定条件下用下中位数和众数去反映变量数列的一般水平是非常有效的。
1、算数平均数
算术平均数是计算平均指标的最常用方法,它的基本公式形式是总体标志总量除以总体单位总量。在实际工作中,由于资料的不同,算术平均数有两种计算形式:
简单算数平均数:适用于总体资料未经分组整理、尚为原始资料的情况。
加权算数平均数:适用于总体资料经过分组整理形成变量数列的情况 。
2、调和平均数
在实际工作中,有时由于缺乏总体的单位数资料,而不能直接计算平均数,这时就可采用调和平均数计算。因此在统计工作中,调和平均数常常被作为算术平均数的变形来使用。调和平均数也有简单调和平均数和加权调和平均数两种形式。
简单调和平均数:加权调和平均数的特例,当各组标志总量等于1。
加权调和平均数: 适用于总体资料经过分组整理形成变量数列的情况。
3、几何平均数
是N项变量值连乘积的开N次方根,用于计算现象的平均比率或平均速度。 几何平均数也分为简单几何平均数和加权几何平均数。
应用的前提条件:各个比率或速度的连乘积等于总比率或总速度;相乘的各个比率或速度不为零或负值。
简单几何平均数: 适用于未分组资料 。
加权几何平均数: 适用于未分组资料 。
4、中位数
中位数是将总体各单位标志值按大小顺序排列后,处于中间位置的那个数值。根据未分组资料和分组资料都可确定中位数。
中位数不受极端值及开口组的影响;对于分配不对称的数据,中位数比平均值更适合当集中趋势的代表值;对某些不具有数字特征或不能用数字测定的现象,可用中位数表示其一般水平。
5、众数
众数是总体中出现次数最多的变量值。在单位数不多或一个无明显集中趋势的资料中,众数的测定没有意义。一般来讲,只有根据分组数列才能确定众数。
它也不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平,适用于定类数据。
6、众数、中位数和算术平均数的比较
a、算术平均数综合反映了全部数据的信息,众数和中位数由数据分布的特定位置所确定。
b、算术平均数和中位数在任何一组数据中都存在而且具有惟一性。
c、算术平均数只能用于定量(数值型)数据,中位数适用于定序数据和定量数据,众数适用于所有形式(类型、计量层次)的数据。
d、算术平均数要受数据中极端值的影响。而众数和中位数都不受极端值的影响。
e、算术平均数可以推算总体的有关总量指标,而中位数和众数则不宜用作此类推算。
四、变异指标
变异指标是综合反映总体各单位标志值及其分布的差异程度的指标。变异指标包括以下几种:四分位差、平均差、标准差和方差。当比较两个不同水平总体的平均数代表性大小时,须采用变异指标中的全距指标。
1、四分位差和全距
全距是标志的最大值和最小值的差。四分位差即数据分布中第25个和第75个百分位数的间距,也即第1个和第3个四分位数的间距。在一定程度上四分位差是对极差的一种改进,避免了极端值的干扰,适用于定序数据和定量数据,尤其是当用中位数来测度数据集中趋势时。
2、平均差
平均差是各个数据与其算术平均数的离差绝对值的算术平均数。
3、方差与标准差
方差(variance)是各变量值与其均值离差平方的平均数。标准差(standard deviation)是方差的平方根,又称“均方差”。