python kmeans聚类用于分析什么_使用scipy-kmeans进行聚类分析

最新推荐文章于 2021-11-16 10:10:16 发布

weixin_42421284

最新推荐文章于 2021-11-16 10:10:16 发布

阅读量358

点赞数

文章标签： python kmeans聚类用于分析什么

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42421284/article/details/113962171

版权

本文探讨了在二维空间点群聚类时遇到的问题，使用scipy.cluster.vq.kmeans进行聚类分析，发现未增白和增白后的簇中心位置不准确。尽管点群分离良好，但kmeans未能提供预期结果。文章提出了对scipy.cluster.vq.kmeans在简单聚类问题上可能存在的问题，并寻求解决方案。

摘要由CSDN通过智能技术生成

我想了解^{}。在

由于在二维空间中分布了许多点，问题是将它们分组成簇。这个问题在阅读this question时引起了我的注意，我认为scipy.cluster.vq.kmeans将是一个好办法。在

以下是数据：

使用下面的代码，目标是获得25个簇中每个簇的中心点。在import numpy as np

import matplotlib.pyplot as plt

from scipy.cluster.vq import vq, kmeans, whiten

pos = np.arange(0,20,4)

scale = 0.4

size = 50

x = np.array([np.random.normal(i,scale,size*len(pos)) for i in pos]).flatten()

y = np.array([np.array([np.random.normal(i,scale,size) for i in pos]) for j in pos]).flatten()

plt.scatter(x,y, s=16, alpha=0.4)

#perform clustering with scipy.cluster.vq.kmeans

features = np.c_[x,y]

# take raw data to cluster

clusters = kmeans(features,25)

p = clusters[0]

plt.scatter(p[:,0],p[:,1], s=81, c="crimson")

# perform whitening (normalization to std) first

whitened = whiten(features)

clustersw = kmeans(whitened,25)

q = clustersw[0]*features.std(axis=0)

plt.scatter(q[:,0],q[:,1], s=25, c="gold")

plt.show()

结果如下：

红点表示没有增白的簇中心的位置，黄点表示使用增白的点。虽然它们是不同的，但主要的问题是它们显然不是都在正确的位置上。因为集群都是很好地分离的，我很难理解为什么这个简单的集群会失败。在

我读过this question，它报道了kmeans没有给出准确的结果，但答案并不是真正的statisfactory。将kmeans2与minit='points'一起使用的建议解决方案也不起作用；即kmeans2(features,25, minit='points')给出了与上述类似的结果。在

所以问题是，有没有一种方法可以用scipy.cluster.vq.kmeans来执行这个简单的聚类问题？如果是这样的话，我如何确保得到正确的结果呢。在

weixin_42421284

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。