灰色关联分析

基本思想

灰色关联分析是指对一个系统发展变化态式的定量描述和比较的方法,基本思想是通过确定参考数据列和若干个比较数据列的集合形状相似程度来判断其联系是否紧密,反映了曲线间的关联程度。

根据序列曲线几何形状的相似程度来判断其联系是否紧密,曲线越接近,相应序列之间的关联度就越大,反之就越小。

在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,则两者关联程度较高;反之较低。

灰色关联分析法是根据因素之间发展趋势的相似或者相异程度,即灰色关联度,作为衡量因素间关联程度的一种方法。

灰色关联分析的对象往往是一个系统,系统的发展会收到多个因素的影响,通常想知道,在众多影响因素中,哪些是主要因素,哪些是次要因素,哪些因素影响大,哪些因素影响小,哪些具有促进作用,哪些具有抑制作用。

基本特征

  1. 总体性

灰色关联度虽然是数据序列几何形状的接近程度的度量,但它一般强调的是若干个数据序列对一个既定的数据序列接近的相对程度,即要排出关联度大小的顺序,将各因素同一放置于系统中进行比较和分析。

  1. 非对称性

在同一系统中,甲对乙的关联度,并不等于乙对甲的关联度,这较真实的反映了系统重因素之间真实的灰关系。

  1. 非唯一性

关联度随着参考序列不同,因素序列不同、原始数据处理方法不同、数据多少不同而不同。

  1. 动态性

因素间的灰色关联度随着序列的长度不同而变化,表明系统在发展过程中,各因素之间的关联关系也随着时间不断变化。

相关概念

灰色关联度有绝对关联度和相对关联度之分,绝对关联度采用初始点零化法进行初始值化处理,其中初始点零化法即将序列的初始点置零,保持后续的序列走向获得新的数据序列。当分析的因素差异较大时,由于变量间的量纲不一致,往往影响分析,难以得出合理的结果。

相对关联度:相对关联度用相对量进行分析,计算结果仅与序列相对于初始点的变化速率有关,与各观测数据大小无关,在一定程度上弥补了绝对关联度的缺陷。

流程步骤

  1. 根据分析目的确定分析指标体系,收集分析数据

以Z市国内生产总之的统计数据(以百万元计)为例,通过灰色关联度分析计算出Z市从2000年到2005年之间哪一种产业对GDP总量影响最大。

图表如下:

三个问题:

谁与国内生产总值关联度最高?

哪个产业发展的更好?

哪年发展的较优秀?

设n个数据序列形成如下矩阵:

其中m为指标的个数,

2.确定参考数据列

通常,根据分析目标确定参考数据列

目标一,指标排序优选,指标体系中的指标与对标指标的关联度的大小,并可以数值大小排序;

按照业务选择理想比较基准,例如在此需要分别将三种产业与国内生产总值比较计算其关联程度,故参考序列为国内生产总值。

目标二,综合评价,评价指标,给出量化数值,以及优良顺序。

若是解决综合评价问题,则参考序列可能需要自己生成,通常选定每个指标或时间段中所有子序列中的最佳值组成的新序列为参考序列。其中参考序列应该是一个理想的比较标准,可以以各指标的最优值(或者最劣值)构成参考数据列,也可根据评价目的选择其他参照值。

以上述国内生产总值的数据为例,若想计算出谁与国内生产总值关联度最高,则选择国内生产总值列为参考列;若想计算出哪个产业发展的好,选择每个指标的最优值(最大)值,手工生成参考数列;若想计算哪年发展的较为优秀,选择各个年度的最优值,手工生成参考数列。

参考数列记作:

3.对指标数据进行无量纲化

由于系统中各因素的物理意义不同,导致数据的纲量也不一定相同,不便于比较,或在比较时难以得到正确的结论,因此在进行灰色关联度分析时,一般都要进行无量纲化的数据处理。

对数据进行无量纲处理的方法:

无量纲化后数据序列形成如下矩阵:

4.求解参考序列和特征序列之间的灰色关联系数值

  1. a求差序列

逐个计算每个被评价对象指标序列(比较序列)与参考序列对应元素的绝对差值:

其中,n为被评价对象的个数。

  1. b求两级差

1.c求关联系数

其中,k=1,……,m。ρ为分辨系数,取值在(0,1),ρ若越小,关联系数间差异越大,区分能力越强,通常取0.5。

5计算关联度

对各评价对象(比较指标序列)分别计算各个指标与参考序列对应元素的关联系数的均值,以反映各评价对象与参考序列的关联关系,并将均值记为关联度序列。

6.综合评价

如果各指标在综合评价中所起的作用不同,可对关联系数求加权平均值,即:

其中,Wi

为各个指标的权重。权重的确定通常有两种方法,一是等权重,二是采用层次分析法所确定的权重。

算法结果

最终得到关联度序列:

综合评价指标:

总结

指标排序,可以得到:

通过比较三个子指标序列与参考序列的关联度可以得出结论:该地区在2000年到2005年期间的国内生产总值收到第三产业的影响最大。

综合评价,可以得到:

通过比较指标综合评价可以得出结论:该地区在2000年到2005年期间,第一产业的发展最好。

适用场景

1.灰色关联分析通常用来分析各个因素对结果的影响程度,也可以运用此方法解决随时间变化的综合评价类问题。

2.进行系统发展影响因素分析,诊断影响系统发展的重要因素。

3.用于综合评价问题,给出研究对象或者方案的优劣排名,可用于经营管理咨询工作。

4.灰色系统理论提出了对各子系统进行灰色关联度分析的概念,去寻求系统中各子系统(或因素)之间的数值关系。灰色关联分析对一个系统发展变化态势提供了量化的度量,非常适合动态历程分析。

优点:

  1. 灰色关联分析法的样本容量可以少到4个,对样本的个数要求不高。
  2. 对无规律数据同样适用,不会出现量化结果与定性分析结果不符的情况
  3. 思路清晰

4.灰色关联分析可以发现变量之间的潜在关联性,即使在数据中存在噪音或者干扰的情况下,也能够找到能够量化各个因素对结果的影响程度,帮助决策者更好地理解因素之间的关系。

缺点:

  1. 灰色关联分析是从纯数据的角度取研究关联性,如果两个没什么关系的指标,在曲线上表现得极为相似,灰色关联分析就会认为两者的关联程度很高。
  2. 灰色关联分析对于数据的质量要求较高,如果数据存在较大的误差或者不完整的情况下,分析结果可能会受到影响。
  3. 灰色关联分析在处理大量数据时,计算量较大,需要花费较多的时间和资源。

改进点

  1. 在通过灰色关联分析分析数据之间的关联性之前,首先结合场景分析指标之间的关系,然后再结合关联度序列共同分析数据之间的关联性。例如,在处理家庭用电量的影响因素时,统计了每户家庭中的人口以及人口年龄分布,此时家庭中人口的数量对用电量影响较大,家庭人口数量较多的住户用电量较大,而家庭人口的年龄对用电量影响甚微甚至没有相关性,则需要在进行灰色关联分析之前对数据进行初筛。
  2. 结合场景改进综合评价中各个指标的权重。例如在处理家庭用电量的影响因素时,采集到了家庭中人口以及夏季每天温度的数据,考虑到人们在夏季用电量较大,对用电量影响较大,则在计算相关性时,可以给夏季的温度数据序列赋予更大的权重;而在其他季节,赋予家庭人口个数序列更大的权重。
  3. 结合场景对分辨系数做出改进,具体实施过程在下述论文分析模块中。
  4. 数据的质量评价,对质量不佳的数据舍去,对质量较好的数据根据质量评价指数建立不同数据对结果的影响程度,达到数据质量越好,数据对最终关联度结果评价的影响越大的目的,同时,避免低质量数据对结果的影响。例如在分析城市固废环境影响因子时,对数据进行初筛,筛选掉采集过程中获取的质量较差的数据,例如在采集影响因子毒性的数据时,检测数据中是否存在明显异常的数据,并将其剔除,然后再进行关联度分析。

论文分析

《基于改进关联分析的城市固废环境影响因子筛选》

该论文在数据处理之前就对城市固废环境影响因子进行了初筛,并结合场景设定了初筛的原则:

避免出现毫无逻辑关系的指标经过灰色关联分析后依然计算出较大关联性的问题。

同时该论文分析了原有灰色关联算法中存在的问题:

分辨系数的量化方法尚未被确定,通常取固定值0.5,这种取值的随机性较强,导致评价结果说服力的降低;另外,恒定的分辨系数还可能降低关联系数的有效性,造成灰色关联度十分相近,区分度不足。同时这种固定取值的方式并不完全适用实际问题,可能会使得各因子关联度平均化,由此增加因子筛选难度,容易出现指标误删的情况,使筛选结果失真。

论文针对上述问题,对分辨系数做出了改进,基本思想如下:

  1. 基于灰色关联分析的基本原理,分析关联系数的计算结构,研究分辨系数在关联度中的实际作用,确定出分辨系数量化的取值原则。
  2. 根据分辨系数的取值原则,结合变异系数的特性,引入序列变异系数构造分辨系数量化取值方式,使得分辨系数的取值可以依据序列本身指标情况确定,代替人为主观确定分辨系数取值的方法,使得关联度能够充分反映所蕴含信息的整体性和差异性。

具体调整方式如下:

  1. 分辨系数动态调整原则:
  1. 分辨系数应根据序列整体分布特性情况动态调整;
  2. 当序列分布较为离散时,分辨系数应较小,以削弱序列过于离散对关联度造成的不合理支配
  3. 当序列分布较为集中时,分辨系数应较大,以便使得关联度充分反映信息的整体性和差异性。
  1. 考虑指标序列的变异系数动态调整分辨系数

根据指标序列的变异系数构造出了分辨系数的量化方式,如下:

则改进后的灰色关联分析法如下:

  • 21
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值