机器学习：聚类,Sklearn

最新推荐文章于 2023-12-06 14:04:58 发布

潮阿景

最新推荐文章于 2023-12-06 14:04:58 发布

阅读量427

点赞数 1

分类专栏：机器学习文章标签：聚类 sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74958046/article/details/127850927

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本文探讨了k-means和高斯混合模型在聚类实验中的应用，通过sklearn实现并比较了两种初始化方法对k-means的影响。实验涉及基本数据集、太极数据集、圆环数据集和多类数据集，结果显示k-means计算量小，而高斯混合模型更灵活但计算复杂。实验加深了对两种聚类算法原理的理解，但需进一步研究代码细节。

摘要由CSDN通过智能技术生成

一、实验要求

在计算机上验证和测试k-means聚类和高斯混合模型聚类实验，sklearn的相关聚类算法。

实验目的

1、掌握k-means聚类算法的原理

2、掌握高斯混合模型聚类算法的原理；

3、掌握sklearn如何实现聚类；

三、实验内容

实验步骤

请根据cluster文件代码，根据K均值聚类算法的原理，有两种初始化方法，一种是随机中心点，一种是随机分类，请修改代码实现另一种初始化也就是随机分类代码，然后观察聚类过程比较两种随机初始化方法效果。

随即中心点

1-4 5-8

随机分类

1-4 5-8

随即中心点的初始点选择是不确定的，可能会导致最后模型的结果不稳定。随即分类不需要确定分类数，更能突出模型的准确率。

请对比sklearn的K均值聚类和混合高斯模型，针对make_blobs生成的基本数据集， makemoons生成的太极数据集，makecircles生成的圆环数据集，多类数据集，对比聚类的效果如何。

基本数据集

KMeans

高斯混合

太极数据集

KMeans

高斯混合

圆环数据集

KMeans

高斯混合

多类数据集

KMeans

高斯混合

KMeans的计算量小，方便进行运算。

高斯混合模型的计算量大，可以看作是KMeans的推广，当每个混合模型没有足够的点时，估算协方差变得困难起来，同时算法会发散并且找具有无穷大似然函数值的解，除非人为地对协方差进行正则化

四、实验总结

本次实验基本完成，难度适中，对k-means聚类算法的原理，高斯混合模型聚类算法的原理，sklearn如何实现聚类有了更深的了解，但相关代码的具体作用还需要理解消化。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

潮阿景 CSDN认证博客专家 CSDN认证企业博客

码龄2年

17: 原创

142万+: 周排名

136万+: 总排名

7088: 访问

: 等级

173: 积分

1: 粉丝

3: 获赞

2: 评论

11: 收藏

私信

关注

热门文章

分类专栏

html 2篇
机器学习 4篇
js 1篇
Flask 7篇
Linux 1篇
C语言程序设计 2篇

最新评论

flask入门
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。