本篇博文主要讲解一下模糊聚类的相关内容。
在讲解模糊聚类之前,先把模糊数学中几个我们主要用到的公式讲一下。
(1)模糊矩阵的交,并,余,转置操作
(2)模糊矩阵的乘法。
对于模糊矩阵的乘法,可能有点不明白。看下图就差不多明白了。
第一行X第一列:0.7X0.9最大,取较小的0.7
第一行X第二列:0.3X0.9最大,取较小的0.3
(3)模糊矩阵的传递闭包:
模糊数学中的详细内容,如果有兴趣的话,可以自行百度了解。接下来说一下模糊聚类了。
模糊聚类分析
模糊识别又称为模糊分类。从处理问题的角度来看,模糊识别可以分为有监督的分类和无监督的分类两种类型。
在模糊理论中,一个元素与一个集合的关系不再是简单的属于或者不属于关系。
如图所示,一个元素与集合的关系:属于,不属于,部分属于。因此在模糊理论中引入的隶属函数跟经典数学中的隶属函数有所不同。
经典数学中的隶属函数值域为{0,1},而在模糊数学中的隶属函数值域则根据隶属程度在[0,1]。
举个简单的例子说明一下:
根据年龄可以将人分为儿童,青年,中年,老年。一个人2岁,可以认为是儿童,但是如果一个人是30岁,那他属于青年或者中年的的界限就有点模糊了。我们可以认为0.7的概率属于青年,0.3的概率属于中年。这个例子就是说明一下,跟以前的硬聚类不一样,模糊聚类属于软聚类,它允许一个对象属于多个簇。
具体算法如下:
(1)建立数据矩阵。
(2)数据标准化。
因为在实际的问题中,不同的数据可能有不同的量纲,为了能够比较,通常进行数据规格化。常用的方法有标准差标准法,极差正规化,最大值规格化。
(3)建立模糊相似关系矩阵。
求出x(i)与x(j)的相似关系矩阵,常用的方法有相似系数法,距离法,贴近度法,余弦法。
(4)聚类
下面以一个例子说明一下:有五个传感器,每个传感器有四个特征,对传感器进行聚类分析
那么此时五个传感器属于五个类别。
此时可以分为四个簇:第二个传感器与第四个传感器在一个簇中。
以此类推。
总结之:模糊聚类与之前的硬聚类有了很大的不同,允许一个对象按照不同的概率属于不同的簇。下一篇博文将学习一下具体的模糊聚类算法。