聚类分析tensorflow实例_[机智的机器在学习] TensorFlow实现Kmeans聚类

最新推荐文章于 2024-05-06 21:57:58 发布

玥霏

最新推荐文章于 2024-05-06 21:57:58 发布

阅读量431

点赞数 1

文章标签：聚类分析tensorflow实例

本文链接：https://blog.csdn.net/weixin_36163672/article/details/111898741

版权

[点击蓝字，一键关注~]

对于机器学习算法来说，主要分为有监督学习和无监督学习，前面有篇文章介绍过机器学习算法的分类，不知道的童鞋可以去看看。然后今天要讲的Kmeans算法属于无监督算法，也就是说它的输入只要训练集没有标签的。说到Kmeans，就不得不提什么是聚类？简单说就是“合并同类项”，把性质相近的物体归为一类，就是聚类。这样就自然会产生两个问题，1，怎么确定分类的种类数目，也就是说，把所有的样本数据分为几类比较合适？ 2，怎么衡量归在一类的样本“性质”是不是相近？如果解决了这两个问题，那么简单的聚类问题就解决了。

Kmeans是一种比较古老聚类算法，但是应用非常广泛。(鬼知道，反正我没怎么用过~)。Kmeans其实包含两个部分，一个是K，一个是means，我们分别来解释一下。首先对于n个样本属于R^n空间(也就是实数空间)中的点，K就是表示把样本分类多少类，K等于几，就分为几类。当我们做完聚类以后，每一类最中心的那个点，我们叫做聚类中心(centroids)，聚类的过程或者目标是：每个类里面的样本到聚类中心的距离的平均值(menas)最小。注意理解一下这句话，通俗理解一下，假设分为3类，A， B, C三类，分别包含m，n，p个样本，聚类中心分别为M，N，P。那么对于A类来说，m个样本分别到点M的距离就有m个，这m个距离必然是不一样的，所以我们对着m个数求平均值，记做mean_1，如果聚类正确的话，则mean_1是所有聚类可能中距离的means最小的那个。Kmeans就是这样的。。。。

下面是kmeans的目标函数，C是聚类中心，卡方是所有训练数据。

Kmeans算法的步骤：

随机选择k个初始聚类中心

计算所有样本到每个聚类中心的距离，使得样本点到ci的距离比到cj的距离要更近，当i不等于j的时候。

更新聚类中心C，使得ci是所有附近点的中心。

重复2,3，知道聚类中心不再变化。

下面我们用TensorFlow来实现以下Kmens算法，数据还是iris数据。

正式实战开始之前，有几个tf的函数需要简单说一下，大家可能没有见过的，主要是：

tf.unsorted_segment_sum

tf.slice

tf.tile

tf.control_dependencies

tf.group

## tf.unsorted_segment_sum

tf.unsorted_segment_sum和tf.segment_sum类似，而tf.segment_sum和tf.reduce_sum类似，reduce系列之前讲过，不清楚的同学可以翻一下历史消息。然后我们看个栗子。其实说到这里，也是想告诉大家一个学习TensorFlow的方法，就是当你不知道某个函数怎么用的时候，那就写个简单的栗子，自己随便编几个tensor，去试一试就知道怎么回事了。

importos

importtensorflow astf

os.environ['TF

最低0.47元/天解锁文章

玥霏

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
聚类分析tensorflow实例_[机智的机器在学习] TensorFlow实现Kmeans聚类

[点击蓝字，一键关注~]对于机器学习算法来说，主要分为有监督学习和无监督学习，前面有篇文章介绍过机器学习算法的分类，不知道的童鞋可以去看看。然后今天要讲的Kmeans算法属于无监督算法，也就是说它的输入只要训练集没有标签的。说到Kmeans，就不得不提什么是聚类？简单说就是“合并同类项”，把性质相近的物体归为一类，就是聚类。这样就自然会产生两个问题，1，怎么确定分类的种类数目，也就是说，把所有的...
复制链接

扫一扫

聚类分析tensorflow实例_[机智的机器在学习] TensorFlow实现Kmeans聚类

“相关推荐”对你有帮助么？