吴恩达deeplearning.ai:聚类算法

本文探讨了聚类算法与二分类算法的对比,重点介绍了聚类算法如K-means,其通过无监督学习自动识别数据结构并进行分类。应用领域包括新闻分类、DNA分析等。
摘要由CSDN通过智能技术生成

以下内容有任何不理解可以翻看我之前的博客哦:吴恩达deeplearning.ai专栏


聚类算法通过分析大量数据,自动把数据分为好几个不同的类别。让我们看看具体是怎么做的。

对比——聚类算法和二分类算法

二分类算法

在我们之前提到过的二分类算法之中,你的数据集的每组数据包含两钟数据x,y;其中x代表每个数据的具体特征输入,而y代表每个特征的输出,同时包含输入和输出,那么就可以设计函数进行拟合,从而得到如图中红色线类似的拟合曲线。
在这里插入图片描述

聚类算法 Clustering Algorithm

在聚类算法之中,我们的输入仅仅包含一个输入x,所以图中的点不再被提前人为划分为类似上图的圆圈和叉叉,而是一堆黑点。因为没有标签y,所以我们不知道数据需要划分为几类。因此我们需要算法自己好好努力,去找到一些这些数据的特点,从而让算法替我们把数据划分。
在这里插入图片描述
今天我们要了解的算法叫做聚类算法,它的工作方式是寻找你的数据里面的特定结构,并将同一类型的结构划分到一组之中,从而完成分类。

聚类算法的应用

聚类算法常用于:

  1. 新闻分类
  2. DNA分析
  3. 市场目标人群划分
  4. 天文分析
    在这里插入图片描述

最常用的聚类算法——K-means Algorithm

让我们举个例子:
在这里插入图片描述
上图中的黄点是一些输入特征,k-means算法的第一步是会随机选择两个点,这里表现为红色和蓝色,它们可能表示的是两个不同集群的中心。如下图,当然,这两个选择可能不那么好,但是这只是一个开始:
在这里插入图片描述
k-means算法在接下来的时间会重复做两件事情:

  • 将点分配给这两个质心
  • 移动簇质心

让我们看这意味着什么。
算法的第一步是随机猜测这些点的集群中心在哪里,它猜测的点叫做簇质心。在猜测完之后,算法将遍历图中所有的数据,然后计算这个数据是更接近红色or蓝色,并将它分给离它近的那个质心。这样就完成了刚刚所说的第一步。
在这里插入图片描述
k-means的第二步是它会查看所有的红/蓝点并取平均值,并将质心移动到平均值所在位置:
在这里插入图片描述
之后再重复以上步骤。
一直这样做下去之后,你会发现到某个时刻质点不再移动,此时数据就被成功地划分为两类了。
在这里插入图片描述
为了给读者你造成不必要的麻烦,博主的所有视频都没开仅粉丝可见,如果想要阅读我的其他博客,可以点个小小的关注哦。

  • 27
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

江安的猪猪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值