周志华《机器学习》Ch9. 聚类：k-means算法的python实现

最新推荐文章于 2022-11-15 14:28:13 发布

da_kao_la

最新推荐文章于 2022-11-15 14:28:13 发布

阅读量2.2k

点赞数 2

分类专栏： Machine Learning Python 周志华《机器学习》读书笔记文章标签：西瓜书周志华聚类 k-means算法

本文链接：https://blog.csdn.net/da_kao_la/article/details/82792209

版权

理论

k-means方法是一种常用的聚类方法，其目标是最小化

$\sum\limits_{i=1}^k\sum_{j=1}^{m_i}||x_{ij}-\mu_i||$

其中 $\mu_i$ 是第i个簇的中心。直接优化上式有难度，故k-means算法采用一种近似方法。

简单来说，k-means算法由两个步骤循环组成：

1. 计算每个sample到各个簇中心的距离，将该sample的类标赋为距离最近的簇的类标；

2. 按照sample的类标重新计算各个簇中心

k-means算法有两个输入参数需要用户指定，一个是簇的个数，另一个是循环次数

代码

# -*- coding: utf-8 -*-
"""
k-means algorithm
From 'Machine Learning, Zhihua Zhou' Ch9
Model: k-means clustering algorithm
Dataset: P202 watermelon_4.0 (watermelon_4.0.npy)

@author: weiyx15
"""

import numpy as np
import matplotlib.pyplot as plt

class kMeans:
    def load_data(sel

最低0.47元/天解锁文章

da_kao_la

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
4
评论
周志华《机器学习》Ch9. 聚类：k-means算法的python实现

理论k-means方法是一种常用的聚类方法，其目标是最小化其中是第i个簇的中心。直接优化上式有难度，故k-means算法采用一种近似方法。简单来说，k-means算法由两个步骤循环组成：1. 计算每个sample到各个簇中心的距离，将该sample的类标赋为距离最近的簇的类标；2. 按照sample的类标重新计算各个簇中心k-means算法有两个输入参数需要用户指定，一...
复制链接

扫一扫

专栏目录