在系统学习指数编制方法之前,先介绍一下几个指数编制过程中会经常使用的数据处理方法,如:数据标准化方法、权重设置方法、异常值处理方法。因为在后面指数编制过程中会经常用到这些方法。接下来我还是按照分类,分别介绍一下这些方法。这一篇,先介绍一下常用的几种数据标准化方法。
除简单的统计对比分析外, 统计分析更多的是针对较复杂的社会经济现象, 需要用比较广泛的统计指标, 即利用由众多指标构成的统计指标体系进行描述与分析。而利用多指标进行统计分析, 往往需要借助于各种各样的统计综合合成方法, 如多指标的综合评价、聚类分析、主成分分析、关联分析,等等。为此, 需要指标之间具有综合性。然而, 各指标由于性质不同、计量单位不同, 往往缺乏综合性。此外, 当各指标间的水平相差很大时, 如果直接用原始指标值进行分析, 就会突出数值较高的指标在综合分析中的作用, 相对削弱数值水平较低指标的作用, 从而使各指标以不等权参加运算分析。为避免这一点, 解决各指标数值可综合性的问题, 必要时需要对各指标数值进行标准化(无量纲化)处理。
无量纲化, 也叫数据的标准化、规格化, 它是通过简单的数学变换来消除各指标量纲影响的方法。无量纲化方法有多种,归结起来有以下几类。
一.直线型无量纲化方法
直线型无量纲化法是指在指标实际值转化成不受量纲影响的指标值时, 假定二者之间呈线性关系, 指标实际值的变化引起标淮化后数值一个相应的比例变化。线性无量纲化方法主要有:
- 离差标准化(极值法)
利用指标的极值(极大值或极小值)计算指标的无量纲值,计算公式主要有:
x i ′ = x i m a x x i x_i^{'} =\frac{x_i}{max_{x_i}} xi′=maxxixi
x i ′ = m a x x i − x i m a x x i x_i^{'} =\frac{max_{x_i}-x_i}{max_{x_i}} xi′=maxxi