一、基本概念
什么是灰色系统,这个概念比较奇怪,是用颜色来衡量一个系统的特性,那么是不是还有其他颜色系统如红色系统、蓝色系统等,其实还真有其他颜色的系统,只不过不是前面说的漂亮颜色而是黑色系统和白色系统。从颜色上大概能猜出这两个颜色的差别,黑色类似于穿着外套的美女对于她的内在你啥都不知道,白色类似于一位脱光了的美女,你啥都知道了。而灰色就是介于黑白之间是一位穿着比基尼女郎,看到一些但是又没看到你想要的。
上一段说的比较俗大家不要介意,如果更像理解灰色系统可以举个例子就明白了。例如一个城市的交通事故看做是一个系统,那么为什么说这个是灰色系统呢,因为交通事故的发生不是独立的,它是和很多因素相关,如城市的车辆有多少、城市的人口有多少、城市的道路情况等。二这些因素你都可以查询得到,而有些因素你是无法确定的,如天气情况、交通事故前的偶发因素等。所以对我们只掌握部分交通事故的信息系统可以称为灰色系统。其实生活中大部分的系统都属于灰色系统,所以对于灰色系统的研究就很有必要,这对于一位致力于数据挖掘的农名工来说是有必要搞明白的。
二、灰色系统理论主要内容
前面说的两段只是让大家大概了解什么是灰色系统,对于灰色系统从上个世纪到现在逐渐发展成了四大体系如下:
1、基础理论体系:该体系以灰色代数、灰色方程、灰色矩阵为基础
2、方法体系:该体系以灰色序列生成方法为基础;
3、分析体系:该体系以灰色关联分析为基础
4、模型体系:以灰色模型GM为核心并包含了系统分析、评估、建模、预测、决策、控制、优化等主体;
本文中只总结了方法体系和分析体系,以后会重点介绍灰色系统的模型体系,而灰色系统基础理论体系这里只做简单的介绍,对于具体的理论介绍,大家可以去看刘思峰的灰色系统理论和实践这本书。
三、灰色系统基础理论体系
灰色系统使用灰数、灰色方程和灰色矩阵描述的系统,其中灰数是灰色系统中最基本的单元。
什么是灰数,灰数就是系统中不确定只知道大概情况的数,实际应用中就是表示那些不确定的数,数学中用来表示。灰色又可分为多种如仅有上界灰数、仅有下界灰数、连续灰数、离散灰数、区间灰数、本征灰数、非本征灰数等。区间灰数存在运算,这里我就不一一列出需要了解的去查询灰色系统理论和实践这本书
什么是灰色方程,灰色方程又可分为代数方程和微分方程,代数方程就是含有灰数的方程,含有灰色倒数或者微分的方程称为灰色微分方程,灰色微分方程是很重要的概念,其是以后要介绍的灰色系统建模的基础,也会在后面着重介绍。
什么是灰色矩阵,就是含有灰数或者灰元的矩阵称为灰色矩阵,也有灰色矩阵运算方式这里就不一一介绍,感兴趣的可以去看书。
四、灰色系统方法体系
什么是灰色序列生成呢,灰色序列生成就是对原始数据进行整理找出数据变化的规律,是一种从数据中寻找规律的途径。这有别于随机过程,因为随机过程是依赖于先验概率,然后研究出数据的分布,但这需要大量的数据。事实上灰色序列生成就是通过某种途径弱化数据的随机性,显示出其规律的方法。
生成灰色序列的方法称为序列算子,其作用就是为了降低外在因素对系统的冲击而导致数据失真,设系统的行为数据为,序列算子为那么其一阶算子为
其二阶算子为
当然还有三阶、四阶以及n阶。
序列算子主要分为两类一个是弱化算子,该算子使得原数列增长或者衰减的速度更慢。还有一类是强化算子,该算子可以是原序列增长或者衰减的速度更快。
- 常用算子分类:
1、初值化算子
其中,称为初值化算子,称为原像称为原像的初值像。
2、均值化算子
其中,称为均值化算子,称为在算子下的象,简称均值象。
3、区间值算子
其中 ,称为区间化算子,称为区间象。
4、累加生成算子
其中 ,称为X的一阶累加生成算子,同理在一阶基础上可以有二阶、三阶、N阶累加。
5、累减生成算子
其中 ,称为X的一阶累减生成算子,同理在一阶基础上还有二阶、三阶等累减
除了以上五个较为常用的算子还有其他算子比如逆化算子、倒数化算子等。
- 级比、光滑比与准光滑序列
级比的定义很简单就是行为数列中前后数的比值,即
光滑比的定义就是第k个数据与前面所有数据之和的比值,即
级比和光滑比的作用可以用来填补序列端点的空值,如{1,2,3,4,5}这个数列需要填充两端数据那么可以计算级比或者光滑比然后就可以得到。
准光滑序列的定义是满足以下三个条件
准光滑序列经过一次累加计算后就称为光滑序列。
五、灰色系统的分析体系
灰关联分析法的基本思想是根据序列曲线几何形状的相似度来判断两个序列是否联系紧密,相似度越高代表联系越紧密。在进行系统分析是还需要确定系统行为特征向量Y,该向量可以是一组或者多组,如城市交通系统中其特征向量可以交通事故次数,也可以是交通死亡人数也可以是其他代表交通事故的特征,后面可以根据影响系统因素来判定哪个是最有效的行为特征。
如果在对系统行为进行量化研究时,要确保系统行为向量和各个影响因素之间不受量纲的影响,也就是将所有向量通过序列算子变成无量纲数据。
在上述介绍的几种常用的序列算子中初值化算子、均值化算子、区间值化算子被常用来进行量纲归一,但是三者不宜混用,可以根据实际情况进行三选一。
灰色关联度的数学定义:
其中称为系统特征序列和相关因素序列,表示第i个相关因素序列。
表示特征序列与各个相关因素序列的关联度,为在k点的关联系数。
为分辨系数,
关联度满足四大特征
(1)规范性,表明系统中两个行为序列都不可能严格无关;
(2)整体性,表明环境对灰关联的影响,当环境变化是灰关联很可能不满足对称性;
(3)偶对称性,表明在系统中只有两个序列时他们是满足对称性;
(4)接近性,表明关联度的量化约束;
如果想看他们特征的数学表示可以查询上述的那本书。
综上所述,灰关联度的计算主要分为5步:
1、求初值象或者均值象
2、求差序列,即两个序列之间的距离,参考n维空间两个点之间的距离公式;
3、求两级差,即灰关联子空间中n个序列组成n维的距离矩阵,找出该矩阵中的最大值和最小值
4、计算关联系数,通过上述关联系数计算公式计算出关联系数
5、计算关联度
对于关联度的计算中求初值象的序列化算子不同,关联度可分为绝对关联度、相对关联度和综合关联度,其中绝对关联度是以为初始化值,相对关联度是以为初始化值,综合关联度是将前面这两按照加权系数综合计算得到。
灰色系统中优势分析
优势分析是灰色系统中一种系统行为序列和影响因素序列的定量分析,它结合上述序列之间的关联度计算,提出了灰色关联矩阵,最后通过关联度矩阵找出行为序列和因素序列中的最优因素,以及影响因素的排序,下图为灰色关联矩阵。
其中为行为序列和因素序列的关联度。当然根据关联度的分类又可以分为灰色绝对关联矩阵、灰色相对关联矩阵以及灰色综合关联矩阵。
若存在时满足,那么称因素优于因素。
三种关联度矩阵往往得出因素排序结果不完全相同,主要是因为绝对关联矩阵计算出的绝对关联序是从绝对量的角度考虑,相对关联矩阵得出的相对关联序是相对于原始点变化速率的角度考虑,而综合关联序是综合绝对量和相对变化速率的角度考虑,实际应用中,只要考虑绝对关联序即可。
六、应用实例
对于灰色系统的优势分析可以参考该博客灰色系统优