聚类

最新推荐文章于 2024-05-02 12:53:50 发布

勤劳的凌菲

最新推荐文章于 2024-05-02 12:53:50 发布

阅读量553

点赞数

分类专栏：机器学习（Machine learning）文章标签：聚类机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Suan2014/article/details/77750160

版权

机器学习（Machine learning）专栏收录该内容

24 篇文章 1 订阅

订阅专栏

PS:最近好懒，一丢丢都不想敲公式，所以本章就以核心思想及算法流程的思想来介绍了。

1 聚类任务

聚类是一种无监督的学习方式，试图将数据集中的样本划分为若干个通常是不相交的子集，每个子集称为一个“簇”（cluster）,每个簇可能对应于一些潜在的类别。

聚类过程仅能自动形成簇结构，簇所对应的概念语义需由使用者来把握和命名。

2 原型聚类

原型聚类假设聚类结构能通过一组原型刻画，在现实聚类任务中极为常用。通常情形下，算法先对原型进行初始化，然后对原型进行迭代更新求解。

2.1 k均值算法

给定样本集

，k均值算法所针对聚类所得簇划分 $C=\left \{ C_{1},C_{2},...,C_{k} \right \}$ 最小化平方误差

(1)

其中

是簇 $C_{i}$ 的均值向量，（1）式刻画了簇内样本围绕均值向量的紧密程度，E值越小则簇内样本相似度越高。

（1）式的求解是一个NP难的问题，因此采用贪心策略，通过迭代来近似求解（1）

2.2 学习向量量化

学习向量量化（Learning Vector Quantization, LVQ）试图找到一组原型向量来刻画聚类结构，但与一般聚类算法不同的是，LVQ假设数据样本带有类别标记，学习过程中利用样本的这些监督信息来辅助聚类。

2.3 高斯混合聚类

高斯混合聚类采用概率模型来表达聚类原理。

对于服从高斯分布的向量

,其概率模型密度函数为：

(2)

其中u是n为均值向量，

为nXn的协方差矩阵。

定义高斯混合模型分布

(3)

若训练集

，令随机变量

表示生产样本

的高斯混合成分，其取值未知，则

(4 )

图中的式（9.30）即（4），（9.31）即

3 密度聚类

该类算法假设聚类结构能通过样本分布的紧密程度确定。通常情形下，密度聚类算法从样本密度的角度来考察样本之间的可连接性，并基于可连接样本不断扩展聚类簇以获得最终的聚类结果。

DBSCAN是一种著名的密度聚类算法，其核心思想为：用一个点的邻域内的邻居点数衡量该点所在的空间密度。其详细原理可参考http://blog.csdn.net/itplus/article/details/10088625

4 层次聚类

层次聚类（hierarchical clustering）试图在不同层次对数据记性划分，从而形成树形的聚类结构，数据集的划分可采用“自底而上”的聚类策略，也可采用“自顶向下”的分拆策略。

AGNES是一种采用自底向上聚合策略的层次聚类算法，其核心思想是先将数据集中的每个样本看作一个初始聚类簇，然后在算法运行的每一步中找出距离最近的两个聚类簇进行合并，该过程不断重复，直至达到预设的聚类簇个数。

其中d（.,.）为距离。

勤劳的凌菲

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
聚类

PS:最近好懒，一丢丢都不想敲公式，所以本章就以核心思想及算法流程的思想来介绍了。1 聚类任务聚类是一种无监督的学习方式，试图将数据集中的样本划分为若干个通常是不相交的子集，每个子集称为一个“簇”（cluster）,每个簇可能对应于一些潜在的类别。聚类过程仅能自动形成簇结构，簇所对应的概念语义需由使用者来把握和命名。2 原型聚类原型聚类假设聚类结构能通过一组原型刻画，在现实聚类
复制链接

扫一扫

专栏目录

勤劳的凌菲 CSDN认证博客专家 CSDN认证企业博客

码龄10年

106: 原创

4万+: 周排名

110万+: 总排名

47万+: 访问

: 等级

4959: 积分

185: 粉丝

236: 获赞

169: 评论

832: 收藏

私信

关注

热门文章

分类专栏

Deep Learning 97篇
Tracking 1篇
matlab 3篇
Super-Resolution 5篇
python 15篇
机器学习（Machine learning） 24篇
图像处理 28篇
C++ 23篇
Caffe 11篇
Pytorch 7篇
问答系统 29篇
工具 7篇
Reinforcement learning 2篇
语音 11篇
系统 3篇

最新评论

tensorrt官方int8量化方法汇总
勤劳的凌菲: onnx需转为tensorrt才能用，onnx是没有NMS算子的
tensorrt官方int8量化方法汇总
yunqian_: 用yolov5_pytorch_ptq.py，生成的best.onnx，推理时python detect.py --weights best_ptq.onnx 报错，onnxruntime.capi.onnxruntime_pybind11_state.Fail: [ONNXRuntimeError] : 1 : FAIL : Load model from best_ptq.onnx failed:Fatal error: TRT:EfficientNMS_TRT(-1) is not a registered function/op，，请问是什么原因呢
分类精度评价
立青246: 在哪儿找到呀？
使用ubuntu-drivers devices查找nvidia driver安装避坑
2401_83005834: ubuntu-drivers devices执行之后终端没有显示
conda的极速安装包mamba
拓宽视野: 离线包位置： https ://github.com/conda-forge/miniforge/releases chmod +x Miniforge-pypy3-Linux-x86_64.sh bash Miniforge-pypy3-Linux-x86_64.sh -f -b -p ./mamba39

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

勤劳的凌菲 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。