聚类算法

最新推荐文章于 2023-05-10 18:07:42 发布

sinat_37333675

最新推荐文章于 2023-05-10 18:07:42 发布

阅读量208

点赞数

分类专栏：机器学习文章标签：聚类机器学习算法

本文链接：https://blog.csdn.net/sinat_37333675/article/details/107065187

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

原型聚类—— $K - m e a n s$
输入：样本集 $D=\left\{x_{1},x_{2},...,x_{m}\right\}$ ，聚类簇数 $k$
输出：簇划分
过程：随机选择 $k$ 个样本作为初始聚类均值向量，计算每个样本到聚类均值向量的距离，将样本划分到离均值向量最近的簇中，重新计算聚类均值向量。重复上述过程，直到聚类均值向量不再变化或者达到迭代次数。

原型聚类—— $L V Q$
输入：样本集 $D=\left\{(x_{1},y_{1}),(x_{2},y_{2}),...,(x_{m},y_{m})\right\}$ ，原型向量个数 $q$ ，各原型向量预设类别标记，学习率 $\eta$
输出：簇划分原型向量（簇之间的分割线）
过程：随机选择 $q$ 个样本作为初始原型向量，随机选择一个样本 $x_{j},y_{j})$ ，计算其到 $q$ 个原型向量之间的距离，若距离最近的那个原型向量 $q_{i^*}$ 的预设类别标记与该样本的标记 $y_{j}$ 相同，更新原型向量 $q_{i}=q_{i}+\eta*(x_{j}-q_{i})$ ，即原型向量靠近该样本，若不同，更新原型向量 $q_{i}=q_{i}-\eta*(x_{j}-q_{i})$ ，即原型向量远离该样本。重复上述过程，直至达到最大迭代次数或者原型向量更新很小或不再更新。

密度聚类—— $D B S C A N$
输入：样本集 $D=\left\{x_{1},x_{2},...,x_{m}\right\}$ ，邻域参数 $(\epsilon半径,Minpoints)$
输出：聚类簇
过程：根据邻域参数确定核心对象集合，随机选择一个核心对象，找出由它密度可达的所有样本，形成一个聚类簇。去除聚类簇中包含的核心对象，更新核心对象集合，从新的核心对象集合中随机选择一个核心对象形成下一个聚类簇。重复上述过程，直到核心对象集合为空。

层次聚类—— $A G N E S$
输入：样本集 $D=\left\{x_{1},x_{2},...,x_{m}\right\}$ ，聚类簇 $k$ ，聚类簇间距离度量函数 $d(i,j)=dist(C_{i},C_{j})$
输出：聚类簇
过程：将每个样本都看成一个聚类簇，初始化簇距离矩阵 $M (i, j) = d (i, j)$ ， $M$ 的维度是聚类簇个数*聚类簇的个数，不断合并距离最近的两个聚类簇，减少聚类簇的个数，并更新簇距离矩阵 $M$ ，直达聚类簇个数达到预设个数 $k$ 。

sinat_37333675

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
聚类算法

原型聚类——K−meansK-meansK−means输入：样本集D={x1,x2,...,xm}D=\left\{x_{1},x_{2},...,x_{m}\right\}D={x1,x2,...,xm}，聚类簇数kkk输出：簇划分过程：随机选择k个样本作为初始聚类均值向量，计算每个样本到聚类均值向量的距离，将样本划分到离均值向量最近的簇中，重新计算聚类均值向量。重复上述过程，直到聚类均值向量不再变化或者达到迭代次数。原型聚类——LVQLVQLVQ输入：样本集D={(x1,y1),(x2,
复制链接

扫一扫

专栏目录