kmeans算法简单实现

最新推荐文章于 2024-07-24 14:05:30 发布

freekwy

最新推荐文章于 2024-07-24 14:05:30 发布

阅读量1.4k

点赞数 1

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/k2325/article/details/109135914

版权

# -*- coding:utf-8 -*-

# kmeans简单实现

"""
kmeans是经典的无监督聚类方法。步骤可以分为以下几步：
1.确定聚类的数目k
2.随机初始化k个聚类中心
3.根据准则（一般计算欧式距离）将数据分配到对应的聚类中心
4.更新每个类别的聚类中心（均值）
5.重复步骤2-步骤4若干次
"""


import numpy as np
import random
from collections import  defaultdict
import matplotlib.pyplot as plt

class KMeans():

    def __init__(self, data, k, max_iter=5):
        # 初始化变量
        self._data = data # 数据
        self._k = k # 簇
        self._max_iter = max_iter # 最大迭代次数
        self._example_num = data.shape[0] # 有多少个数据
        self._centroids = None # 设置质心
        self._cluster_data_indices = None # 具体的每个簇

    def _random_init_centroid(self):
        # 随机初始化质心，保证质心在数据点之中
        # sample函数，随机选择一个点做初始化质心
        random_centroid_indicss = random.sample(
            range(3, self._example_num), self._k)
        centroids = self._data[random_centroid_indicss]
        self._ce

最低0.47元/天解锁文章

freekwy

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
kmeans算法简单实现

# -*- coding:utf-8 -*-# kmeans简单实现"""kmeans是经典的无监督聚类方法。步骤可以分为以下几步：1.确定聚类的数目k2.随机初始化k个聚类中心3.根据准则（一般计算欧式距离）将数据分配到对应的聚类中心4.更新每个类别的聚类中心（均值）5.重复步骤2-步骤4若干次"""import numpy as npimport randomfrom collections import defaultdictimport matplotlib.p.
复制链接

扫一扫

专栏目录