【多元】多元正态分布,聚类分析

这篇博客介绍了多元正态分布和聚类分析的基本思想、类型、相似性度量和方法。对于聚类分析,它强调了相似性、分类数的确定原则,并详细讨论了系统聚类法、模糊聚类、k均值聚类和有序样品聚类。博客提供了多个相关链接以深入学习。
摘要由CSDN通过智能技术生成

目录

多元正态分布

聚类分析

1. 基本思想

2. 两种类型

3. 相似性度量

4. 分类数的确定原则

5. 聚类方法

5.1 系统聚类法(谱系聚类法/层次聚类法)

5.2 模糊聚类

5.3 k均值聚类

5.4 有序样品的聚类

Q&A


多元正态分布

鉴于自己数理基础弱,这部分不做整理了,放一些看了有收获的相关文章,以便参考。

《多元正态分布》https://blog.csdn.net/omade/article/details/28232047

提出了多维随机变量;多元中,均值用均值向量代替,方差用协方差矩阵代替。给出了多元正态分布表达式,推导了二维。

聚类分析

1. 基本思想

通过相似程度(距离远近、相关关系),选取度量样本或指标相似程度的统计量,对对象分类,使同类中对象的相似性>与其他类的对象的相似性。目的是,使类内对象同质性最大,使类间对象异质性最大。

基本思路是,选择研究的变量(指标),如有必要则做数据标准化,求相似性,选择聚类方法和类数,对聚类结果解释并评价(评价方法:[1]R^2、伪F值; [2]每次分类的结果做方差分析,研究各类的均值是否有显著差异;多元方差分析/多元均值检验; [3]反复聚类,比较结果,分析可靠性、稳定性。)

注:聚类是不需要提前确定各类标准的,它是根据对象的相似性而分出的类。其实在生活中很常见,比如我们会比较他人和自己的处境相似程度以决定如何行动最有效,远古人类没有经验却能区分动植物大致种类,未受艺术教育的观众也可以将抽象派和写实派的画作聚类。


相关链接(均属于拓展内容),按照知识复杂程度(个人划分的),由浅到深排列。

《聚类方法(Clustering)》https://wenku.baidu.com/view/0307c12d4b35eefdc8d333db.html

讲座报告。聚类分析的目的是,寻找潜在的“自然”分组结构、感兴趣的关系。介绍了一些聚类算法及数据挖掘方面的聚类。

《聚类分析的思路和方法》https://wenku.baidu.com/view/1b74ff5184868762caaed5e2.html

与《多元统计分析》(何晓群)的逻辑基本一致。指出了聚类过程是形成一个由小到大的分类系统;聚类的应用如识别用户群体,如根据顾客的购买频率、时间、年龄、性别、消费额等聚类,识别最有消费潜力的用户的特征并投放对应的广告。

《聚类分析》https://wenku.baidu.com/view/564a70c064ce0508763231126edb6f1aff0071fb.html

部分内容与《实用多元统计分析》一致。

《聚类分析在用户分类中的应用》https://blog.csdn.net/howardge/article/details/38538003

《arcgis 地图聚类工具》https://blog.csdn.net/niusi1288/article/details/74356846

《聚类(clustering)与分类(Classification)的区别》

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值