从零开始机器学习（十二）

最新推荐文章于 2024-07-17 21:38:09 发布

live_for_myself

最新推荐文章于 2024-07-17 21:38:09 发布

阅读量107

点赞数

分类专栏：吴恩达老师机器学习笔记文章标签： pytorch 机器学习

本文链接：https://blog.csdn.net/landing_guy_/article/details/116923989

版权

吴恩达老师机器学习笔记专栏收录该内容

14 篇文章 3 订阅

订阅专栏

文章目录

简介

在非监督学习中，我们的数据没有附带任何标签，我们拿到的数据就是这样的：
在这里插入图片描述
也就是说，在非监督学习中，我们需要将一系列无标签的训练数据，输入到一个算法中，然后我们告诉这个算法，快去为我们找找这个数据的内在结构给定数据。我们可能需要某种算法帮助我们寻找一种结构。图上的数据看起来可以分成两个分开的点集（称为簇），一个能够找到我圈出的这些点集的算法，就被称为聚类算法。

在这里插入图片描述
当然，还有其他类型的非监督学习算法，它们可以为我们找到其他类型的结构或者其他的一些模式，而不只是簇。

K均值算法

K-均值是最普及的聚类算法，算法接受一个未标记的数据集，然后将数据聚类成不同的组。
K-均值是一个迭代算法，它会做两件事，一个是簇分配 $\ assignment)$ , 第二个是移动聚类中心：随机选择的 $K$ 个随机的点，称为聚类中心（cluster centroids）， $K$ 是想要分的簇的个数。

对于数据集中的每一个数据，按照距离 $K$ 个中心点的距离，将其与距离最近的中心点关联起来，与同一个中心点关联的所有点聚成一类。下图中分为两个簇，离随机的红色中心点近的被分为红簇，蓝色被分为蓝簇。

在这里插入图片描述

计算每一个组的平均值，将该组所关联的中心点移动到平均值的位置。下图计算红簇的中心点，把红色随机中心点的位置移动。蓝色中心点也是这样操作。

在这里插入图片描述

重复把点分配给聚类中心，移动聚类中心这两步，直至中心点不再变化。

用 $μ^1$ , $μ^2$ ,…, $μ^k$ 来表示聚类中心，用 $c^{(1)}$ , $c^{(2)}$ ,…, $c^{(m)}$ 来存储与第 $i$ 个实例数据最近的聚类中心的索引，K-均值算法的伪代码如下：

Repeat {

for i = 1 to m

c(i) := index (form 1 to K) of cluster centroid closest to x(i)

for k = 1 to K

μk := average (mean) of points assigned to cluster k

}

算法分为两个步骤，第一个for循环是赋值步骤，即：对于每一个样例 $i$ ，计算其应该属于的类。第二个for循环是聚类中心的移动，即：对于每一个类 $K$ ，重新计算该类的质心。

K-均值算法也可以很便利地用于将数据分为许多不同组，即使在没有非常明显区分的组群的情况下也可以。

$K$ 均值算法的优化目标

对几个变量再说明一下：
$c^{(i)}$ 是 $x^{(i)}$ 所在簇的索引, 比如 $x^{(i)}$ --> 5, 那么 $c^{(i)}$ =5.
$\mu_{c^{(i)}}$ 是簇中心点所在位置

K-均值的代价函数（又称畸变函数 Distortion function）为：
$J(c^{(1)},...,c^{(m)},μ_1,...,μ_K)=\dfrac {1}{m}\sum^{m}_{i=1}\left\| X^{\left( i\right) }-\mu_{c^{(i)}}\right\| ^{2}$