机器学习-KMeans算法案例

1.某电信运营商获得若干用户通讯行为数据(“data_02”),有字段“通货次数”, ”短信次数”,”即时通讯次数”,”网页浏览次数”,使用 KMeans 算法,对这部分客户群体进行合理分群。
在这里插入图片描述

import numpy as np,pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
from sklearn.metrics import silhouette_samples

# 导入数据
data=pd.read_csv("data_02.csv",index_col=0)

# 绘制轮廓系数曲线,找到合适的k值
score=[]
for i in range(
  • 3
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我可以为您提供机器学习kmeans算法在西瓜数据集上的实例。首先,让我们了解一下西瓜数据集。 西瓜数据集是一个著名的二元分类数据集,其中包含17个属性和2个类别。属性包括色泽,根蒂,敲声,纹理等等。类别分别为好瓜和坏瓜。下面是西瓜数据集的前几行数据: | 编号 | 色泽 | 根蒂 | 敲声 | 纹理 | 脐部 | 触感 | 密度 | 含糖率 | 好瓜 | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 1 | 青绿 | 蜷缩 | 浊响 | 清晰 | 凹陷 | 硬滑 | 0.697 | 0.46 | 是 | | 2 | 乌黑 | 蜷缩 | 沉闷 | 清晰 | 凹陷 | 硬滑 | 0.774 | 0.376 | 是 | | 3 | 乌黑 | 蜷缩 | 浊响 | 清晰 | 凹陷 | 硬滑 | 0.634 | 0.264 | 是 | | 4 | 青绿 | 蜷缩 | 沉闷 | 清晰 | 凹陷 | 硬滑 | 0.608 | 0.318 | 是 | | 5 | 浅白 | 蜷缩 | 浊响 | 清晰 | 凹陷 | 硬滑 | 0.556 | 0.215 | 是 | 现在,我们可以使用kmeans算法对这个数据集进行聚类。下面是Python代码的示例: ```python import pandas as pd from sklearn.cluster import KMeans # 读取数据集 data = pd.read_csv('watermelon.csv', encoding='gbk') # 取出数据集中的属性值 X = data.iloc[:, 1:-1] # 设置聚类数量为2 kmeans = KMeans(n_clusters=2) # 对数据进行聚类 kmeans.fit(X) # 输出聚类结果 print(kmeans.labels_) ``` 在这个示例中,我们使用`pandas`库读取了西瓜数据集,并使用`sklearn.cluster`库中的`KMeans`类对数据进行聚类。我们设置聚类数量为2,并使用`fit`方法对数据进行聚类。最后,我们输出了聚类结果。 希望这个示例对您有所帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值