萌新开始学算法

最新推荐文章于 2024-01-29 15:36:03 发布

天大的芝麻

最新推荐文章于 2024-01-29 15:36:03 发布

阅读量121

点赞数

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012575252/article/details/106208707

版权

算法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

自白

我没有经过科班出身，半路出家进了软件行业，既然选择了远方，便只顾风雨兼程，在此csdn上记录我的所想所得。话不多说，今天开始学聚类。以下内容来源于<<我的第一本算法书>>这本书

聚类

将相似的对象分为一组

聚类就是在输入为多个数据时，将"相似"的数据分为一组的操作。1个组就叫做1个"簇"。下面的示例中每个点都代表1个数据，在平面上位置较为相近，被圈起来的点就代表一类相似的数据。也就是说，这些数据被分为了3个簇。

如何定义相似

定义数据间的差距

根据数据类型不同，定义该数据是否"相似"的标准也不同。具体来说，就是要对两个数据之间的"差距"进行定义。
假设某所高中的某个年级共有400名学生没现在我们想要将这些学生在考试中取得的语文，数学，英语成绩数据化，并将他们按照"擅长或不擅长的科目相似"进行聚类。
把每个学生都转换成"(语文成绩，数学成绩，英语成绩)“形式的数据后，就可以将两个数据(c1,m1,e1)和 (c2,m2,e2)之间的差距定义为(c1-c2)2+（m1-m2)2+(e1-e2)2,其中差距小的数据就互为"相似的数据”。

符合条件的算法

即使定义好了数据间的差距，聚类的方法也会有很多种。可以设定各种各样的条件，比如想把数据分为10个簇，或者想把1个簇内数据间的最大距离设为10,等等。而设定什么样的条件取决于进行聚类的目的。
假如是为了开办暑期补习班而对学生进行分班，那么就要根据老师和教室的数量来确定"簇的数量"，并根据教室的面积确定"每个簇内的数据量"。现在有很多种可以满足各类条件的聚类算法可供选择。下一篇文章将介绍其中最基本，也是最有代表聚类算法"k-means算法"。该算法可以把数据按要求分为k个簇。

天大的芝麻

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
萌新开始学算法

聚类
复制链接

扫一扫

专栏目录

天大的芝麻 CSDN认证博客专家 CSDN认证企业博客

码龄11年

2: 原创

144万+: 周排名

184万+: 总排名

700: 访问

: 等级

20: 积分

0: 粉丝

0: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

分类专栏

算法 2篇

最新文章

k-means算法

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。