Kmeans实战-实现二维的bolo分析

首先导入包:

# 导入包
import matplotlib.pyplot as plt     # 画图的包
import numpy as np     
import pylab as mpl  # import matplotlib as mpl
from sklearn.datasets import make_blobs   # 产生数据集

默认设置:

mpl.rcParams['font.sans-serif'] = ['FangSong']  # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题

进行初始化:

n_samples = 1500  # 生成1500个数据集
random_state = 170  # 170这个是随机种子
k = 3  # 超参数
np.random.seed(26)    #给numpy设置一个随机种子,保证每次都能产生相同的值
X, y = make_blobs(n_samples=n_samples, random_state=random_state)    # 生成数据集,包括1500个样本
ages = np.vstack((X[y == 0][:500], X[y == 1][:500], X[y == 2][:500]))   # 将数据进行堆叠,shape为(1500, 2)
y = np.array(([0] * 500 + [1] * 500 + [2] * 500))  #生成0 1 2 各500个

迭代初始化:

centers = np.zeros([3, 2])    # 生成0矩阵
centers_random = np.random.choice(range(len(y)), 3)  # 迭代起点
centers_new = ages[centers_random]   # 随机选取中心
dis_to_cent = np.zeros((k, len(ages)))  # 一个二维数据,相当于一个空的容器

实现预测:

while not (centers_new == centers).all():
    centers = centers_new.copy()  # 注意python的赋值过程,进行展开讲解,== is 和复制方式
    for ii in range(k):
        dis_to_cent[ii] = np.linalg.norm(ages - centers[ii], axis=1)    # 计算每个数值到中心的距离

    clusters = dis_to_cent.argmin(axis=0)   # 划分出每个类别

    for ii in range(k):   # 重新计算中心
        cluster = ages[clusters == ii]
        centers_new[ii] = ages[clusters == ii].mean(0)

    print(centers, centers_new)
    print(centers_new)
    print('centers_new==centers?', (centers_new == centers).all())
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值