面试手撕kmeans算法

我是京城小白

已于 2022-04-20 11:02:59 修改

阅读量1k

点赞数

分类专栏：机器学习文章标签：机器学习

于 2022-04-19 20:35:50 首次发布

本文链接：https://blog.csdn.net/wdh315172/article/details/124282768

版权

机器学习专栏收录该内容

24 篇文章 1 订阅

订阅专栏

# 直接上代码
# https://github.com/kevinelstri/Hander-Marchine-Learning-Series/tree/main/K-means

import random

def main(k):
    # 加载数据
    input_list = input_data()
    
    # 初始化聚簇中心
    center_list = random_center(input_list, k)
    
    # kmeans算法，终止条件为 start中心与end中心一致
    result = kmans(input_list, center_list, k)
    
    return result

def input_data(shape=(100, 2)):
    input_list = [[0]*shape[1] for _ in range(shape[0])]
    for i in range(shape[0]):
        for j in range(shape[1]):
            input_list[i][j] = random.uniform(0.0, 1.0)
    return input_list

def random_center(input_list, k):
    center_list = random.sample(input_list, k)
    return center_list

def dist(a_list, b_list):
    return sum([(a_list[inx] - b_list[inx]) ** 2 for inx in range(len(a_list))])

def my_mean(in_list):
    return [sum(k)/float(len(k)) for k in zip(*in_list)]
    
def kmans(input_list, center_list, k):
    start_center_list = center_list
    end_center_list = []
    result_list = [[] for _ in range(k)]
    
    for i in range(len(input_list)):
        temp_list = []
        for j in range(k):
            temp_list.append(dist(input_list[i], center_list[j]))            
        result_list[temp_list.index(min(temp_list))].append(input_list[i])
        
    end_center_list = [my_mean(value) for value in result_list]
    #print(end_center_list)
    
    if start_center_list != end_center_list:
        kmans(input_list, end_center_list, k) # 递归方式实现
        
    return result_list, end_center_list


if __name__ == "__main__":
    print(main(k=3))

我是京城小白

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
面试手撕kmeans算法

# 直接上代码import randomdef main(data_path, k): # 加载数据 input_list = input_data(data_path) # 初始化聚簇中心 center_list = random_center(input_list, k) # kmeans算法，终止条件为 start中心与end中心一致 result = kmeans(input_list, center_list, k) .
复制链接

扫一扫