python sklearn安装_使用Python的sklearn包做kmeans

最新推荐文章于 2023-02-13 16:46:32 发布

weixin_39841717

最新推荐文章于 2023-02-13 16:46:32 发布

阅读量736

点赞数

文章标签： python sklearn安装

本文介绍了如何使用Python的sklearn库进行KMeans聚类，并详细讲解了Silhouette Coefficient、Rand Index和between_SS/total_SS三种评估方法。通过代码示例展示了KMeans聚类的过程及结果评估。

摘要由CSDN通过智能技术生成

使用Python的sklearn包做kmeans

标签：#kmeans##python##编程#

时间：2018/10/31 14:42:14

作者：小木

首先要安装numpy和sklearn包，然后运行sklearn的kmeans方法即可。

这里我们使用了三种评价方法，一种是

##### 1、Silhouette Coefficient

Silhouette Coefficient是对聚类方法进行解释和验证一致性的方法。该技术提供了一个简洁的图形表示，表明每个对象在其集群中的位置。

Silhouette Coefficient是对象与其自身簇（内聚力）相比与其他簇（分离）相似程度的度量。值从-1到+1，其中高值表示对象与其自己的簇很好地匹配并且与相邻簇不匹配。如果大多数对象具有高值，则聚类结果是合适的。如果许多点具有低值或负值，则聚类效果不好，可能具有太多或太少的簇。

可以使用任何距离度量来计算Silhouette Coefficient结果，例如欧几里德距离或曼哈顿距离。

##### 2.Rand Index

Rand索引计算集群（由聚类算法返回）与基准分类的相似程度。人们还可以将Rand指数视为算法所做出的正确决策百分比的度量。它可以使用以下公式计算：

```math

RI = \frac{TP+TN}{TP+FP+FN+TN}

```

这里的TP是真实的正值数量，TN是真实的负值数量，FP是错误正值的数量，FN是错误负值的数量。

##### 3. between_ss / total_ss

这

最低0.47元/天解锁文章

weixin_39841717

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python sklearn安装_使用Python的sklearn包做kmeans

使用Python的sklearn包做kmeans标签：#kmeans##python##编程#时间：2018/10/31 14:42:14作者：小木首先要安装numpy和sklearn包，然后运行sklearn的kmeans方法即可。这里我们使用了三种评价方法，一种是##### 1、Silhouette CoefficientSilhouette Coefficient是对聚类方法进行解释和验证一...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。