专栏文章
数学建模总结(四)——灰色关联分析
一、方法简介(背景综述)
1.系统分析
对于一些抽象系统来讲(经济系统,生态系统,社会系统,教育系统等等),要分析一个指标就需要考虑多方面的因素,而在众多的因素中,哪些是主要因素,哪些是次要因素;哪些因素对系统发展影响大,哪些因素对系统发展影响小;哪些因素对系统发展起推动作用需强化发展,哪些因素对系统发展起阻碍作用需加以抑制等等,这些就是系统分析法的主要思想。
2.系统分析的方法和不足之处
系统分析的方法主要有回归分析,方差分析,主成分分析,但是这些方法都有其局限性:
- 要求有大量数据,数据量少就难以找出统计规律
- 要求样本服从某个典型的概率分布,要求各因素数据与系统特征数据之间呈线性关系且各因素之间彼此无关,这种要求往往难以满足
- 计算量大,一般要靠计算机帮助
- 可能出现量化结果与定性分析结果不符的现象,导致系统的关系和规律遭到歪曲和颠倒
3.灰色关联分析
(1)基本思想:
根据序列曲线几何形状的相似程度来判断其联系是否紧密。曲线越接近,相应序列之间的关联度就越大,反之就越小。
(2)优势之处:
灰色关联分析方法弥补了采用数理统计方法作系统分析所导致的缺憾。它对样本量的多少和样本有无规律都同样适用,而且计算量小,十分方便,更不会出现量化结果与定性分析结果不符的情况。
二、应用一:进行系统分析
1.题目:分析产业对GDP的影响程度
2.题目分析
在本题目中,GDP作为系统,三大产业作为影响GDP的因素,要分析三大产业哪个是主要因素
3.解题步骤
(1)根据表格画出曲线图
由于灰色关联分析是比较曲线的拟合程度,所以画图是必不可少的。
下面是我在Excel中画的曲线图(之后我会专门出一期文章,来总结一下Excel中曲线图的画法)
在画完图之后,还需要根据图来得出相应结论:
- 图中共有四个变量,且四个变量均呈现递增趋势
- 从2000~2005年,三大产业中,第二产业增幅最大,第一产业增幅最小
- 第二产业和第三产业的差距在后三年才逐渐增大
(2)确定分析数列
- 母序列(又称参考数列、母指标): 能反映系统行为特征的数据序列,类似于因变量(此处记为:
)
- 子序列(又称比较数列、子指标):影响系统行为的因素组成的的数据序列,类似于自变量(此处记为:
)
- 则在本题中,GDP为
,三大产业分别为
。
(3)对变量进行预处理(去量纲,缩小变量范围简化计算)
先求出每个指标的均值,再用每个元素除以该均值。
变量 | x0 | x1 | x2 | x3 |
预处理 | 0.7320 | 0.8361 | 0.6828 | 0.7439 |
0.7588 | 0.8838 | 0.6885 | 0.7878 | |
0.8597 | 0.9141 | 0.7812 | 0.9292 | |
1.0125 | 1.0440 | 1.0237 | 0.9847 | |
1.2356 | 1.1069 | 1.2833 | 1.2363 | |
1.4013 | 1.2152 | 1.5405 | 1.3182 | |
均值 | 2716 | 461.6666667 | 1228.833333 | 1025.666667 |
(4)计算子序列中各个指标与母序列的关联系数
母序列
子序列
引入两个指标:
两极最小差:
两极最大差:
定义:,其中
为分辨系数,在灰色关联分析中一般取0.5
且有
表格数据处理如下:
|x0-x1| | |x0-x2| | |x0-x3| | |
a | 0.1041 | 0.0492 | 0.0119 |
0.0006 | 0.1249 | 0.0704 | 0.0289 |
0.0544 | 0.0785 | 0.0694 | |
b | 0.0315 | 0.0112 | 0.0278 |
0.1862 | 0.1288 | 0.0477 | 0.0006 |
0.1862 | 0.1392 | 0.0832 |
(5)灰色关联度计算
定义:为
和
的灰色关联度
0.0931 | 0.0937 | |||
0.4751 | 0.6586 | 0.8922 | ||
0.4299 | 0.5733 | 0.7680 | ||
0.6356 | 0.5462 | 0.5766 | ||
0.7520 | 0.8985 | 0.7753 | ||
0.4224 | 0.6657 | 1.0000 | ||
0.3356 | 0.4035 | 0.5317 | ||
灰色关联度 | 0.5084 | 0.6243 | 0.7573 |
(6)得出最终结论
第三产业的灰色关联度最大,因而GDP受第三产业的影响最大
(7)问题讨论:
<1>什么时候用标准化回归,什么时候用灰色关联分析?
- 当样本n个数较大时,一般使用标准化回归
- 当样本n个数较小时,一般使用灰色关联分析
<2>如果母序列有多个指标,该怎么分析?
如果母序列有指标,则分别计算其对自变量的灰色关联度
三、应用二:用于综合评价(之前的熵权法+topsis)
- 对指标进行正向化
- 对正向化的矩阵进行预处理
- 将预处理后的矩阵每一行取出最大值构成母序列
- 计算各个指标与母序列的灰色关联度
- 计算各个指标的权重
- 计算第k个评价对象的地得分
- 对得分进行归一化