模糊C均值聚类算法（FCM）

最新推荐文章于 2024-01-23 12:07:48 发布

AIHGF

最新推荐文章于 2024-01-23 12:07:48 发布

阅读量6.5k

点赞数 2

分类专栏：聚类分析 MATLAB

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zziahgf/article/details/21024085

版权

MATLAB 同时被 2 个专栏收录

41 篇文章 5 订阅

订阅专栏

23 篇文章 3 订阅

订阅专栏

一、算法描述

模糊聚类算法是一种基于函数最优方法的聚类算法，使用微积分计算技术求最优代价函数．在基于概率算法的聚类方法中将使用概率密度函数，为此要假定合适的模型．模糊聚类算法中向量可以同时属于多个聚类，从而摆脱上述问题．在模糊聚类算法中，定义了向量与聚类之间的近邻函数，并且聚类中向量的隶属度由隶属函数集合提供．对模糊方法而言，在不同聚类中的向量隶属函数值是相互关联的．硬聚类可以看成是模糊聚类方法的一个特例。

设被分类的对象的集合为：X={ 1， 2，⋯， XN}，其中每一个对象有rt个特性指标，设为= ( 1 ， 2，⋯，Xnk)T，如果要把X分成c类，则它的每一个分类结果都对应一个 c×N阶的Boolean矩阵U=[M ]Ⅳ，对应的模糊c划分空间为：

∑M =1，v k；0<∑M ，v i}在此空间上，

模糊c均值算法如下：

Repeat for 1=1，2⋯⋯

Step 1：compute the cluster prototypes(means)

Step 2：compute the distance：

Step 3：Update the partition matrix：

二、算法代码

function [center, U, obj_fcn] = FCMClust(data, cluster_n,options)

% FCMClust.m 采用模糊C均值对数据集data聚为cluster_n类

% 用法：

% 1. [center,U,obj_fcn] =FCMClust(Data,N_cluster,options);

% 2. [center,U,obj_fcn] = FCMClust(Data,N_cluster);

%输入：

% data ---- nxm矩阵,表示n个样本,每个样本具有m的维特征值

% N_cluster ----标量,表示聚合中心数目,即类别数

% options ---- 4x1矩阵，其中

% options(1): 隶属度矩阵U的指数 (缺省值: 2.0)

% options(2): 最大迭代次数

% options(3): 隶属度最小变化量,迭代终止条件(缺省值: 1e-5)

% options(4): 每次迭代是否输出信息标志 (缺省值: 1)

%输出：

% center ---- 聚类中心

% U ---- 隶属度矩阵

% obj_fcn ---- 目标函数值

% Example:

% data = rand(100,2);

% [center,U,obj_fcn] = FCMClust(data,2);

% plot(data(:,1),data(:,2),'o');

% hold on;

% maxU = max(U);

% index1 = find(U(1,:) ==maxU);

% index2 = find(U(2,:) == maxU);

% line(data(index1,1),data(index1,2),'marker','*','color','g');

% line(data(index2,1),data(index2,2),'marker','*','color','r');

% plot([center([1 2],1)],[center([1 2],2)],'*','color','k')

% hold off; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

if nargin~= 2 & nargin ~= 3, %判断输入参数个数只能是2个或3个

error('Too many or too few input arguments!');

end

data_n= size(data, 1); % 求出data的第一维(rows)数,即样本个数

in_n = size(data, 2); % 求出data的第二维(columns)数，即特征值长度

% 默认操作参数

default_options = [2; % 隶属度矩阵U的指数 100; % 最大迭代次数 1e-5; % 隶属度最小变化量,迭代终止条件 1]; % 每次迭代是否输出信息标志

if nargin== 2,

options =default_options;

else

%分析有options做参数时候的情况

% 如果输入参数个数是二那么就调用默认的option;

if length(options) < 4,%如果用户给的opition数少于4个那么其他用默认值;

tmp = default_options;

tmp(1:length(options)) = options;

options = tmp;

end %返回options中是数的值为0(如NaN),不是数时为1

nan_index = find(isnan(options)==1); %将denfault_options中对应位置的参数赋值给options中不是数的位置.

options(nan_index) =default_options(nan_index);

if options(1) <= 1, %如果模糊矩阵的指数小于等于1

error('Theexponent should be greater than 1!');

end

end

%将options 中的分量分别赋值给四个变量;

expo =options(1); % 隶属度矩阵U的指数

max_iter = options(2); % 最大迭代次数

min_impro =options(3); % 隶属度最小变化量,迭代终止条件

display = options(4); % 每次迭代是否输出信息标志

obj_fcn =zeros(max_iter, 1); % 初始化输出参数obj_fcn

U =initfcm(cluster_n, data_n); %初始化模糊分配矩阵,使U满足列上相加为1,

% Main loop 主要循环

for i =1:max_iter,

%在第k步循环中改变聚类中心ceneter,和分配函数U的隶属度值;

[U, center, obj_fcn(i)] = stepfcm(data, U,cluster_n, expo);

if display,

fprintf('FCM:Iteration count =%d, obj. fcn = %f\n', i, obj_fcn(i));

end %终止条件判别

if i > 1,

if abs(obj_fcn(i) - obj_fcn(i-1)) <min_impro,

break;

end,

end

end

iter_n = i; % 实际迭代次数

obj_fcn(iter_n+1:max_iter) = [];

%%%%%%%%%%%%%%%%%%

子函数1

function U = initfcm(cluster_n, data_n)

% 初始化fcm的隶属度函数矩阵

%输入:

% cluster_n ---- 聚类中心个数

% data_n ---- 样本点数

% 输出：

% U ---- 初始化的隶属度矩阵

U =rand(cluster_n, data_n);

col_sum = sum(U);

U =U./col_sum(ones(cluster_n, 1), :);

%%%%%%%%%%%%%%%%%%

% 子函数2

function [U_new, center, obj_fcn] = stepfcm(data, U, cluster_n,expo)

% 模糊C均值聚类时迭代的一步

% 输入：

% data ---- nxm矩阵,表示n个样本,每个样本具有m的维特征值

% U ---- 隶属度矩阵

% cluster_n ----标量,表示聚合中心数目,即类别数

% expo ----隶属度矩阵U的指数

% 输出：

% U_new ----迭代计算出的新的隶属度矩阵

% center ---- 迭代计算出的新的聚类中心

% obj_fcn ---- 目标函数值

mf = U.^expo; % 隶属度矩阵进行指数运算结果

center =mf*data./((ones(size(data, 2), 1)*sum(mf'))'); % 新聚类中心(5.4)式

dist =distfcm(center, data); % 计算距离矩阵

obj_fcn = sum(sum((dist.^2).*mf)); % 计算目标函数值 (5.1)式

tmp = dist.^(-2/(expo-1));

U_new =tmp./(ones(cluster_n, 1)*sum(tmp)); % 计算新的隶属度矩阵(5.3)式

%%%%%%%%%%%%%%%%%

% 子函数3

function out = distfcm(center, data)

% 计算样本点距离聚类中心的距离

% 输入：

% center ---- 聚类中心

% data ---- 样本点

% 输出：

% out ---- 距离

out =zeros(size(center, 1), size(data, 1));

for k = 1:size(center, 1),

%对每一个聚类中心

%每一次循环求得所有样本点到一个聚类中心的距离

out(k,:) = sqrt(sum(((data-ones(size(data,1),1)*center(k,:)).^2)',1));

end

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。