7. 聚类算法 KMeans

1. 应用:大数据杀熟

  • 618、双十一,平台要对用户进行分类:
  • 用户:
    • 脑残粉(不降价,或者涨点价)
    • 墙头草(给点小优惠券)
    • 其他平台用户(打骨折拉客)
  • KMeans是一种广泛使用的聚类算法,属于无监督学习方法,其主要目的是将数据点分组成若干个集群,使得同一个集群内的数据点相似度高,而不同集群间的数据点相似度低。

2. 迭代法

  • 从一个随机状态开始
  • 采用一定的策略,逐步变好
  • 量变达到质变
  • 实现目的
  • 先粗糙的开始,然后慢慢的变好!!!

3. 代码

from sklearn.datasets import make_blobs
from matplotlib import pyplot as plt
import numpy as np
X,y=make_blobs(n_samples=2000,
              n_features=2,
              centers=5,
              cluster_std=0.5)
print(np.unique(np.array(y)))  #:[0 1 2 3 4]
print(X.shape,y.shape)  #: (2000, 2) (2000,)
plt.scatter(X[:,0],X[:,1],c=y)

在这里插入图片描述

from sklearn.cluster import KMeans
km = KMeans(n_clusters=5,algorithm="auto")
# 如果出现报错:‘NoneType‘ object has no attribute ‘split‘  解决方案:pip install --upgrade threadpoolctl
km.fit(X)
print(km.cluster_centers_)
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.scatter(km.cluster_centers_[:, 0], km.cluster_centers_[:, 1], marker="*", s=100, c="red")

[[-5.31628485 -1.45893969]
[-1.0759308 9.94338596]
[ 0.72948784 -2.3113112 ]
[-6.95011209 7.31684924]
[-3.39357312 -4.8877097 ]]
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MechMaster

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值