FCM模糊c均值推导

yz_YYYZZZ

已于 2023-08-05 10:30:26 修改

阅读量878

点赞数 1

分类专栏：聚类算法文章标签：模糊C均值 FCM算法聚类隶属度类中心

于 2022-09-16 19:09:13 首次发布

本文链接：https://blog.csdn.net/qq_45178685/article/details/126896234

版权

聚类算法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

模糊

模糊就是不确定。若把20岁作为确定是否年轻的标准，则21岁是不年轻。生活当中，21也很年轻，可以使用模糊的概念的来理解，即0.8属于年轻，0.2属于不年轻。这里0.8和0.2不是概率，而指的是相似的程度，把这种一个样本属于结果的这种相似的程度称为样本的隶属度，一般用u表示，表示一个样本相似于不同结果的一个程度指标。

以上来自于：https://blog.csdn.net/on2way/article/details/47087201

网课推荐

算法

FCM算法，即模糊C均值（Fuzzy C-means）算法，是一种基于目标函数的模糊聚类算法。

假设有个数据集X，要划分为C个类，那么对应就有C个类中心，每个样本j属于某一类的隶属度为 μij ，n个样本分成c类，模糊划分矩阵维度为c×n。

FCM算法的目标函数：
$\sum_{i=1}^c \sum_{j=1}^n u_{ij}^m ||x_j-c_i||^2 \tag{1}$

$\sum_{i=1}^c u_{ij}=1,j=1,2,\dots n \tag{2}$

可见，目标函数由相应样本的隶属度与该样本到各个类中心的距离相乘组成的，m是一个隶属度因子（可看作样本轻缓程度，类似于 $x^2,x^3$ ）。等式2为约束条件，一个样本属于所有类的隶属度之和为1。

使用拉格朗日函数求极值：

将约束条件拿到目标函数中，则：
$\sum_{i=1}^c \sum_{j=1}^n u_{ij}^m ||x_j-c_i||^2 +\lambda_1(\sum_{i=1}^c u_{i1} -1)+ \dots + \lambda_j(\sum_{i=1}^c u_{ij} -1) + \dots + \lambda_n(\sum_{i=1}^c u_{in} -1)$
分别对变量 $u_{ij}$ , $c_i$ 求导：

对 $u_{ij}$ 求导：

把求和展开如下：
$\begin{bmatrix} u_{11}^m||x_1-c_1||^2 \dots u_{1j}^m||x_j-c_1||^2 \dots u_{1n}^m||x_n-c_1||^2 \\ \dots\\ u_{i1}^m||x_1-c_i||^2 \dots u_{ij}^m||x_j-c_i||^2 \dots u_{in}^m||x_n-c_i||^2\\ \dots \\ u_{c1}^m||x_1-c_c||^2 \dots u_{cj}^m||x_j-c_c||^2 \dots u_{cn}^m||x_n-c_c||^2 \end{bmatrix}$
可以看到含 $u_{ij}$ 只有一项，求导为 $mu_{ij}^{m-1}||x_j-c_i||^2$ ，其余求导均为0。

同理，后面的式子求导为 $\lambda_j$

可得到：
$mu_{ij}^{m-1}||x_j-c_i||^2 + \lambda_j = 0$
化简可得：
$u_{ij}^{m-1} = \frac{-\lambda_j}{m ||x_j-c_i||^2}$

$u_{ij} = \left( \frac{-\lambda_j}{m ||x_j-c_i||^2} \right) ^{\frac{1}{m-1}}=(\frac{-\lambda_j}{m})^{\frac{1}{m-1}} \left(\frac{1}{||x_j-c_i||^{(\frac{2}{m-1})}} \right)\tag{4}$

想办法消掉 $\lambda$ ,将上式带入（2）：

得出：
$(\frac{-\lambda_j}{m})^{\frac{1}{m-1}} =\frac{1}{\sum_{i=1}^c (\frac{1}{\lVert x_j-c_i \rVert^{(\frac{2}{m-1})}})}=\frac{1}{\sum_{k=1}^c (\frac{1}{\lVert x_j-c_k \rVert^{(\frac{2}{m-1})}})} \tag{5}$