聚类方法

最新推荐文章于 2021-10-13 15:59:33 发布

@yuqing_wang

最新推荐文章于 2021-10-13 15:59:33 发布

阅读量231

点赞数

分类专栏：统计学习（李航）

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43199124/article/details/111439275

版权

统计学习（李航）专栏收录该内容

12 篇文章 0 订阅

订阅专栏

聚类分析：无监督学习方法
目标：给定样本，依据他们的相似度或者距离，将其归并到若干个类或簇的数据分析问题

聚类的基本概念

相似度距离的度量

样本矩阵： $X=(x_1,\cdots,x_n)^T \in R^{N\times p}$
闵可夫斯基距离
在这里插入图片描述
马式距离

相关系数

夹角余弦

类或簇

在这里插入图片描述

常用特征

类的均值
$\bar x_G=\frac{1}{n_G}\sum_{i=1}^{n_G}x_i$
类的直径
$D_G=max _{x_i,x_j\in G}d_{ij}$
类的散布矩阵和样本协方差矩阵

类与类之间的距离

在这里插入图片描述

层次聚类

在这里插入图片描述

k均值聚类

目标：将n个样本分到k个不同类或簇

策略

最优化问题：
在这里插入图片描述
将n个样本划分到k个类别

$s(n,k)=\frac{1}{k!}\sum_{l=1}^k(-1)^{k-l}C_k^l(k-l)^n$

算法

在这里插入图片描述

comment

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
聚类方法

聚类分析：无监督学习方法目标：给定样本，依据他们的相似度或者距离，将其归并到若干个类或簇的数据分析问题聚类的基本概念相似度距离的度量样本矩阵：X=(x1,⋯ ,xn)T∈RN×pX=(x_1,\cdots,x_n)^T \in R^{N\times p}X=(x1,⋯,xn)T∈RN×p闵可夫斯基距离马式距离相关系数夹角余弦类或簇常用特征类的均值xˉG=1nG∑i=1nGxi\bar x_G=\frac{1}{n_G}\sum_{i=1}^{n_G}x_ixˉG=n
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。