吴恩达机器学习课程笔记+代码实现(22)Python实现聚类(Programming Exercise 7.1)

最新推荐文章于 2022-10-31 18:55:38 发布

geekxiaoz

最新推荐文章于 2022-10-31 18:55:38 发布

阅读量846

点赞数

分类专栏：吴恩达机器学习课程笔记+代码实现文章标签：聚类 k-mean 吴恩达 Python

本文链接：https://blog.csdn.net/ziqu5721/article/details/88563077

版权

Programming Exercise 7.1:K-means ClusteringPython版本3.6编译环境：anaconda Jupyter Notebook链接：实验数据和实验指导书提取码：i7co本章课程笔记部分见：13.聚类在本练习中，我们将实现K-means聚类，并使用它来压缩图像。我们将实施和应用K-means到一个简单的二维数据集，以获得一些直观的工作原理。 K-...

摘要由CSDN通过智能技术生成

Programming Exercise 7.1:K-means Clustering

Python版本3.6
编译环境：anaconda Jupyter Notebook
链接：实验数据和实验指导书
提取码：i7co
本章课程笔记部分见：13.聚类

在本练习中，我们将实现K-means聚类，并使用它来压缩图像。我们将实施和应用K-means到一个简单的二维数据集，以获得一些直观的工作原理。 K-means是一个迭代的，无监督的聚类算法，将类似的实例组合成簇。该算法通过猜测每个簇的初始聚类中心开始，然后重复将实例分配给最近的簇，并重新计算该簇的聚类中心。我们要实现的第一部分是找到数据中每个实例最接近的聚类中心的函数。

%matplotlib inline
#IPython的内置magic函数，可以省掉plt.show()，在其他IDE中是不会支持的
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
import scipy.io as sio
sns.set(style="whitegrid",color_codes=True)

2-2维kmeans

查看数据和可视化

mat = sio.loadmat('./data/ex7data2.mat')
data2 = pd.DataFrame(mat.get('X'), columns=['X1', 'X2'])
print(data2.head())

#sns.set(context="notebook", style="white")
sns.lmplot('X1', 'X2', data=data2, fit_reg=False)

         X1        X2
0  1.842080  4.607572
1  5.658583  4.799964
2  6.352579  3.290854
3  2.904017  4.612204
4  3.231979  4.939894

<seaborn.axisgrid.FacetGrid at 0x31f5d26d68>

在这里插入图片描述

#找到聚类中心
def find_closest_centroids(X, centroids):
    m = X.shape[0]
    k = centroids.shape[0]
    idx = np.zeros(m)
    
    for i in range(m):
        min_dist = 1000000
        for j in range(k):
            dist = np.sum((X[i,:] - centroids[j,:]) ** 2)
            if dist < min_dist:
                min_dist = dist
                idx[i] = j
    
    return idx

最低0.47元/天解锁文章

geekxiaoz

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
吴恩达机器学习课程笔记+代码实现(22)Python实现聚类(Programming Exercise 7.1)

Programming Exercise 7.1:K-means ClusteringPython版本3.6编译环境：anaconda Jupyter Notebook链接：实验数据和实验指导书提取码：i7co本章课程笔记部分见：13.聚类在本练习中，我们将实现K-means聚类，并使用它来压缩图像。我们将实施和应用K-means到一个简单的二维数据集，以获得一些直观的工作原理。 K-...
复制链接

扫一扫

专栏目录