【点云学习】K-means聚类（Python）

最新推荐文章于 2024-05-15 23:00:00 发布

秦乐乐

最新推荐文章于 2024-05-15 23:00:00 发布

阅读量2.8k

点赞数 1

分类专栏：点云处理

本文链接：https://blog.csdn.net/qinlele1994/article/details/106180756

版权

点云处理专栏收录该内容

13 篇文章 46 订阅

订阅专栏

啃得我很累~~

调试真的很有助于理解代码！！！

import numpy as np
import random
class K_Means(object):
    # k是分组数；tolerance‘中心点误差’；max_iter是迭代次数
    def __init__(self, n_clusters=2, tolerance=0.0001, max_iter=300):
        self.k_ = n_clusters
        self.tolerance_ = tolerance
        self.max_iter_ = max_iter

    #计算各个类别中心点的坐标
    def fit(self, data):
        # 随机选取数据中的中心点
        centers = data[random.sample(range(data.shape[0]), self.k_)]  #从 range(data.shape[0]) 数据中，随机抽取self.k_ 作为一个列表
        old_centers = np.copy(centers) #将旧的中心点 保存到old_centers
        labels = [ [] for i in range(self.k_) ]
        # [[1, 2], [1.5, 1.8], [5, 8], [8, 8], [1, 0.6], [9, 11]
        for iter_ in range(self.max_iter_):  # 循环一定的次数
            for idx, point in enumerate(data): # enumerate 函数用于一个可遍历的数据对象组合为一个索引序列，同时列出数据和数据的下标
                # 默认的二范数 就是距离  将每一个点计算到每个中心的距离  有2类，0 ，1 就是计算一点到2个中心点的距离  
                diff = np.linalg.norm(old_centers - point, axis=1)  # 一个点分别到两个中心点的距离不同，
                diff2 = (np.argmin(diff))  #np.argmin(diff) 表示最小值在数组中的位置  选取距离小的那一点的索引 也就代表了属于哪个类
                labels[diff2].append(idx) # 选取距离小的那一点的索引 也就代表了属于哪个类

            for i in range(self.k_):
                points = data[labels[i], :]   # 所有在第k类中的所有点
                centers[i] = points.mean(axis=0)  #均值 作为新的聚类中心
            if np.sum(np.abs(centers - old_centers)) < self.tolerance_ * self.k_:  #如果前后聚类中心的距离相差小于self.tolerance_ * self.k_ 输出
                break
            old_centers = np.copy(centers)
        self.centers = centers
        self.fitted = True
        # 屏蔽结束

    # 计算出各个点的类别
    def predict(self, p_datas):
        result = []
        # 作业2
        # 屏蔽开始
        if not self.fitted:
            print('Unfitter. ')
            return result
        for point in p_datas:
            diff = np.linalg.norm(self.centers - point, axis = 1)
            result.append(np.argmin(diff))
        # 屏蔽结束
        return result

if __name__ == '__main__':
    x = np.array([[0.5, 0.5], [5.5, 2.5], [1, 7],[1, 2], [1.5, 1.8], [5, 8], [8, 8], [1, 0.6], [9, 11]])
    k_means = K_Means(n_clusters=4)
    k_means.fit(x)  #计算聚类中心
    cat = k_means.predict(x) #确定了聚类中心以后，计算每个点属于哪个聚类中心
    print(cat)

秦乐乐

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
【点云学习】K-means聚类（Python）

啃得我很累~~调试真的很有助于理解代码！！！import numpy as npimport randomclass K_Means(object): # k是分组数；tolerance‘中心点误差’；max_iter是迭代次数 def __init__(self, n_clusters=2, tolerance=0.0001, max_iter=300): self.k_ = n_clusters self.tolerance_ = toler
复制链接

扫一扫

专栏目录