MS聚类分析算法

最新推荐文章于 2024-07-07 17:10:22 发布

soldierluo

最新推荐文章于 2024-07-07 17:10:22 发布

阅读量2.4k

点赞数

分类专栏： MSBI-DM 文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/soldierluo/article/details/74839373

版权

本文介绍了MS聚类分析算法，这是一种用于数据分段和聚类的方法，通过设置Minimum_Support和Cluster_Count来生成分类。内容包括算法的两种分类方式（K-means和EM），与决策树的区别，以及如何在数据挖掘中应用。通过调整参数，例如将Clustering_Count设为8，可以创建8个分类。最后，文章展示了如何通过挖掘模型查看器分析分类关系、特征和准确性，为业务决策提供依据。

摘要由CSDN通过智能技术生成

MS聚类分析算法

它是一种“分段”或“聚类”算法，以将示例分组到包含相似特征的分类中。
它首先标识数据集中的关系，并根据这些关系来生成一系列分类，可以设置MiniMum_Support（分类的最小支持量）和Cluster_Count（大致分类数）来限制分类的数量
它有两种分类算法，通过clustering_method属性来设置
3.1. K-means算法，每个数据点只属于一个分类
3.2. EM算法（默认），每个数据点属于多个分类
决策树与聚类算法的区别
4.1. 决策树：是以目标为导向，分析各属性及其值对目标的影响度来逐步生成决策树的，它最重要的作用是获取输入对输出的想象力的排序。
4.2. 聚类：是根据各属性间的关系来对数据进行分类，它最重要的作用是获取各个群体的共有属性
决策树模型所需数据
5.1. 单键列：数据的主键，不允许复合键
5.2. 输入列：要输入到算法里的数据列，可为离散或连续类型
5.3. 可预测列：输出，要预测的结果（方向）
建立聚类算法挖掘结构
6.1. 参照决策树算法挖掘结构的建立，除了算法不一样，其它的在向导中都一样
6.2. 打开“挖掘模型”-》右键“MicroSoft_Clustering”算法-》设置算法参数-》将“Clustering_Count”设置为8，意思是大致分成8个分类
查看——挖掘模型查看器
7.1. 分类关系图：可以看到算法计算出的分类，和分类间的关

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。