r语言聚类分析_R语言百问百答(16):A股股票聚类分析案例

本文通过A股股票案例,深入解析聚类分析概念,对比Hierarchical(凝聚与分裂法)与K-means聚类算法,并使用R语言进行实际操作,展示不同连接方法的聚类效果。
摘要由CSDN通过智能技术生成

本文通过A股股票案例,介绍什么是聚类(Clustering),Hierarchical聚类和K-means聚类有什么区别。

1.聚类

聚类就是把相同的东西放在一起的意思。聚类分析就是把一些抽象的对象,安装相似程度分类的方法。那么数据分析中为什么需要聚类分析呢?原因主要有以下几个方面。

  1. 我们需要高度可拓展聚类算法(Scalable clustering algorithms)解决大数据的问题。

  2. 我们需要处理各类数据的能力。例如我们需要一些算法,解决数值型,类别型或者二进制的数据。

  3. 高维度。聚类算法不但能够解决低维度问题,还能解决高维度的问题。

  4. 处理噪音数据。数据集里面会有噪音数据,缺失数据甚至一些错误的数据。有一些算法对这些数据很敏感,会导致结果的偏差。

  5. 解释性。聚类的结果应该能够被解释,并且能被人理解,对工作、学习和研究有价值。

2.Hierarchical聚类

Hierarchical的意思是等级。所以,这个方法是按等级把对象分解(Decomposition)的方法。安装分解的方法,Hierarchical聚类又可以分为两类:

  • 凝聚(Agglomerative)法:这是一种自下而上(Bottom-up)的方法。我们先把各对象组成“小团体”,然后不断地把其他对象或者“小团体”加入进来。这个过程反复进行,一直到全部对象都加入。这个是凝聚法系统树图(Agglomera

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值