机器学习10k均值

最新推荐文章于 2024-07-12 15:56:08 发布

weixin_30856725

最新推荐文章于 2024-07-12 15:56:08 发布

阅读量61

点赞数

文章标签：人工智能数据结构与算法

原文链接：http://www.cnblogs.com/fengbing/p/3523613.html

版权

下面介绍无监督机器学习算法，与前面分类回归不一样的是，这个不知道目标变量是什么，这个问题解决的是我们从这些样本中，我们能发现什么。

这下面主要讲述了聚类算法，跟数据挖掘中的关联挖掘中的两个主要算法。

K均值算法工作流程，首先随机确定k个初始点作为质心。然后将数据集中的每个点分配到一个簇中。

具体的讲就是为每个点找到最近的质心，并将其分配给该质心所对应的簇，这一步完成之后，每个簇的质心更新为该簇所有点的平均值。

具体伪代码如下：

为了克服K-均值算法收敛于局部最小值问题，有人提出了二分K-均值算法。

该算法首先将所有点作为一个簇，然后将簇一分为二，之后选择其中一个簇继续进行划分，选择哪一个簇进行划分取决于对其划分是否可以最大程度降低SSE(误差平方的值）。这个过程不断重复，直到用户指定的簇数为止。

具体伪代码如下：

这本书后面的几个算法的思想都不复杂，后续进行实现，先放着。

转载于:https://www.cnblogs.com/fengbing/p/3523613.html

weixin_30856725

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习10k均值

下面介绍无监督机器学习算法，与前面分类回归不一样的是，这个不知道目标变量是什么，这个问题解决的是我们从这些样本中，我们能发现什么。这下面主要讲述了聚类算法，跟数据挖掘中的关联挖掘中的两个主要算法。 K均值算法工作流程，首先随机确定k个初始点作为质心。然后将数据集中的每个点分配到一个簇中。具体的讲就是为每个点找到最近的质心，并将其分配给该质心所对应的簇，这一步完成之后，每个簇的质...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。