k 邻近算法和决策树

最新推荐文章于 2023-05-08 16:18:23 发布

lionnee

最新推荐文章于 2023-05-08 16:18:23 发布

阅读量589

点赞数

本文链接：https://blog.csdn.net/weixin_40736833/article/details/103212175

版权

Python实现-Kmeans聚类算法

1. Kmeans聚类算法

Kmeans聚类算法： k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，其步骤是随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。
本人理解： k均值聚类算法（k-means clustering algorithm）即通过随机得到的K个聚类对象作为聚类中心，把每个对象分配给距离它最近的聚类中心。每次迭代聚类求解都是对不同的聚类中心进行聚类分组求解，直到满足某个条件，不在进行迭代。

问题描述：随机生成100个点,分成N类(N),在100个点中随机出N个点作为初始的分类中心点,计算其他点和这N个点之间的距离，将整个点分给距离最近的点.
收敛条件：计算新的中心点(质心)：通过新生成的聚类求取想x，y平均值。当本次的聚类中心点和上次的聚类中心点距离差小于threshold（限制条件）时，迭代结束。

K-Means算法步骤

    (1)、第一步是为待聚类的点寻找聚类中心；

    (2)、第二步是计算每个点到聚类中心的距离，将每个点聚类到离该点最近的聚类中去；

    (3)、第三步是计算每个聚类中所有点的坐标平均值，并将这个均值作为新的聚类中心。

    反复执行(2)、(3)，直到聚类中心不再进行大范围移动或者聚类次数达到要求为止。

import random
import matplotlib.pyplot as plt
class Kmeans():
    def __init__(self, k):
        '''
        初始化
        :param k:代表聚类中心的个数
        '''
        self.__k = k
        self.__data = []  #存放原始数据,初次生成的100个点
        self.__pointCenter = []   #存放聚类中心点
        self.__result = []      #存放最后的聚类结果
        for i in range(k):      #默认有5个聚类，即生成[[],[],[],[],[]]
            self.__result.append([])   #五个子列表，存放分类的点
            pass
        pass

    def calDistance(self,points1,points2):
        '''
        欧式距离：sprt((x1-x2)^2+(y1-y2)^2)
        :param points1: 一维列表
        :param points2: 一维列表
        :return: 两个点之间的直线距离
        '''
        distance=(sum([(x1-x2)**2 for x1,x2 in zip(points1,points2)]))**0.5  #开平方等于乘以1/2次方
        return distance
        pass

    def randomCenter(self):
        '''
        生成self.__pointCenter：初次聚类中心点列表
        :return:
        '''
        while len(self.__pointCenter)<self

最低0.47元/天解锁文章

lionnee

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
k 邻近算法和决策树

Python实现-Kmeans聚类算法1. Kmeans聚类算法Kmeans聚类算法： k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，其步骤是随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会...
复制链接

扫一扫