【多元】多元正态分布，聚类分析

最新推荐文章于 2023-06-21 13:53:11 发布

jingyu404

最新推荐文章于 2023-06-21 13:53:11 发布

阅读量2.1k

点赞数 1

分类专栏：多元

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42031518/article/details/102864754

版权

这篇博客介绍了多元正态分布和聚类分析的基本思想、类型、相似性度量和方法。对于聚类分析，它强调了相似性、分类数的确定原则，并详细讨论了系统聚类法、模糊聚类、k均值聚类和有序样品聚类。博客提供了多个相关链接以深入学习。

摘要由CSDN通过智能技术生成

目录

多元正态分布

1. 基本思想

2. 两种类型

3. 相似性度量

4. 分类数的确定原则

5. 聚类方法

5.1 系统聚类法（谱系聚类法/层次聚类法）

5.2 模糊聚类

5.3 k均值聚类

5.4 有序样品的聚类

多元正态分布

鉴于自己数理基础弱，这部分不做整理了，放一些看了有收获的相关文章，以便参考。

《多元正态分布》：https://blog.csdn.net/omade/article/details/28232047

提出了多维随机变量；多元中，均值用均值向量代替，方差用协方差矩阵代替。给出了多元正态分布表达式，推导了二维。

聚类分析

1. 基本思想

通过相似程度（距离远近、相关关系），选取度量样本或指标相似程度的统计量，对对象分类，使同类中对象的相似性＞与其他类的对象的相似性。目的是，使类内对象同质性最大，使类间对象异质性最大。

基本思路是，选择研究的变量（指标），如有必要则做数据标准化，求相似性，选择聚类方法和类数，对聚类结果解释并评价（评价方法：[1]R^2、伪F值; [2]每次分类的结果做方差分析，研究各类的均值是否有显著差异；多元方差分析/多元均值检验; [3]反复聚类，比较结果，分析可靠性、稳定性。）

注：聚类是不需要提前确定各类标准的，它是根据对象的相似性而分出的类。其实在生活中很常见，比如我们会比较他人和自己的处境相似程度以决定如何行动最有效，远古人类没有经验却能区分动植物大致种类，未受艺术教育的观众也可以将抽象派和写实派的画作聚类。

相关链接（均属于拓展内容），按照知识复杂程度（个人划分的），由浅到深排列。

《聚类方法(Clustering)》：https://wenku.baidu.com/view/0307c12d4b35eefdc8d333db.html

讲座报告。聚类分析的目的是，寻找潜在的“自然”分组结构、感兴趣的关系。介绍了一些聚类算法及数据挖掘方面的聚类。

《聚类分析的思路和方法》：https://wenku.baidu.com/view/1b74ff5184868762caaed5e2.html

与《多元统计分析》（何晓群）的逻辑基本一致。指出了聚类过程是形成一个由小到大的分类系统；聚类的应用如识别用户群体，如根据顾客的购买频率、时间、年龄、性别、消费额等聚类，识别最有消费潜力的用户的特征并投放对应的广告。

《聚类分析》：https://wenku.baidu.com/view/564a70c064ce0508763231126edb6f1aff0071fb.html

部分内容与《实用多元统计分析》一致。

《聚类分析在用户分类中的应用》：https://blog.csdn.net/howardge/article/details/38538003

《arcgis 地图聚类工具》：https://blog.csdn.net/niusi1288/article/details/74356846

《聚类（clustering）与分类（Classification）的区别》：

最低0.47元/天解锁文章

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
【多元】多元正态分布，聚类分析

多元正态分布、聚类分析（系统、模糊、k均值、有序样品）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。