机器学习05-无监督学习

最新推荐文章于 2024-07-05 19:46:48 发布

Zhou1317fe5

最新推荐文章于 2024-07-05 19:46:48 发布

阅读量110

点赞数

分类专栏：机器学习文章标签：机器学习学习人工智能

本文链接：https://blog.csdn.net/j256904767/article/details/131818653

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

聚类（Clustering）

聚类算法查看大量数据点并自动找到彼此相关或相似的数据点。

K-means

首先做的是随机初始化集群中心的位置，集群中心称为簇质心（Cluster centroids）。
请添加图片描述

接着，重复做两件事，第一个是将点分配给簇质心，第二个是移动簇质心

第一步：遍历这些点中的每一个，并查看它是更接近红十字还是更接近蓝十字。然后把这些点分配给它更接近的簇质心。
请添加图片描述

第二步：查看所有的红点并取它们的平均值。并将红十字移动到红点的平均位置，称为新的簇质心位置。蓝色同理。
请添加图片描述

重复第一步：遍历每一个点并分配。
请添加图片描述

接着重复第二步：移动簇质心。
请添加图片描述

一直重复这两个步骤，直到簇质心的位置没有变化，此时K均值聚类算法已经收敛。
请添加图片描述

K-means算法

第一步：将点分配给簇质心
请添加图片描述

K:共K个聚类中心 $\mu_{1},\mu_{2},\ldots,\mu_{K}$
$c^{(i)}$ = 最接近 $x^{(i)}$ 的聚类中心点的索引(从1到K)
例如：点 $x^{(1)}$ 离聚类中心 $\mu_{1}$ 最近，则 $c^{(i)}$ = 1

第二步：移动簇质心
请添加图片描述

$\mu_k$ = 分配给群组k的点的平均值

K-means的成本函数

$\mu_{C^{(i)}}$ = 示例 $x^{(i)}$ 所在群组的聚类中心点
$J\big(c^{(1)},...,c^{(m)},\mu_1,...,\mu_K\big)=\frac{1}{m}\sum_{i=1}^{m}\big\Vert x^{(i)}-\mu_{c^{(i)}}\big\Vert^2$
m表示训练样本的数量。

$\mu_k$ 和 $\mu_{C^{(i)}}$ 区别：
$\mu_k$ 表示第k个群组的聚类中心点，即将该群组中所有分配给该群组的点 $x^{(i)}$ 的平均值作为新的聚类中心点。 $\mu_k$ 的计算方式是通过对属于第k个群组的所有数据点的均值来获得。

而 $\mu_{C^{(i)}}$ 表示示例 $x^{(i)}$ 所在群组的聚类中心点，是通过将 $x^{(i)}$ 分配给最近的聚类中心点得到的。 $\mu_{C^{(i)}}$ 和 $\mu_k$ 具有相同的含义，只是对应于不同的数据点。 $\mu_{C^{(i)}}$ 是根据每个数据点 $x^{(i)}$ 的分配结果得到的，而 $\mu_k$ 是根据整个群组的数据点求取均值得到的。

因此， $\mu_{C^{(i)}}$ 和 $\mu_k$ 在K-means算法中都用于表示聚类中心点，只是对应于不同的数据点和群组。 $\mu_{C^{(i)}}$ 表示一个特定的数据点的聚类中心点，而 $\mu_k$ 表示整个群组的聚类中心点。

如何初始化簇质心

随机选择样本点作为初始簇质心
请添加图片描述

只选择一次的话容易陷入局部最优
请添加图片描述

多次选择样本点作
为簇质心，最终选择出成本函数最小的那一个
请添加图片描述

选择聚类数量K

Elbow method:
请添加图片描述

对于将T恤分成三个尺码，还是五个尺码，需要考虑成本和利润之间的关系，五个尺码可能挣得更多，但是成本更大。
请添加图片描述

异常检测（Anomaly detection）

异常检测（Anomaly Detection）是一种用于识别和监测数据中异常、异常行为或异常模式的技术。它可以帮助我们在大量数据中自动发现那些与正常行为或模式不同的数据点。

检测制造的飞机发动机是否存在问题，为了简化问题，我们以发动机运行的温度、震动频率作为特征。当新引擎的参数落在中间一堆时，发动机正常，当落在外围时有很大概率存在问题。
请添加图片描述

执行异常检测的最常见方法是通过密度估计的技术。

请添加图片描述

高斯分布

请添加图片描述

对于只有一个特征时，将其应用于异常检测，就是要找到参数 $\mu$ 和 $\sigma^2$ 的合适取值

请添加图片描述

异常检测算法

请添加图片描述

共有m个样本，n个特征，对每一个特征求平均值 $\mu$ 和方差 $\sigma^2$ 。

$\mu_j$ : 第j个特征的平均值
$\sigma_j^2$ : 第j个特征的方差
$p (x)$ : 假定每一个特征 $x_{1}$ 到 $x_{n}$ 均服从正态分布，则其模型的概率为：
$\begin{aligned} p(x)& =p(x_{1};\mu_{1},\sigma_{1}^{2})p(x_{2};\mu_{2},\sigma_{2}^{2})\cdotp\cdotp\cdotp p(x_{n};\mu_{n},\sigma_{n}^{2}) \\ &=\prod_{j=1}^{n}p(x_{j};\mu_{j},\sigma_{j}^{2}) \\ &=\prod_{j=1}^{n}\frac{1}{\sqrt{2\pi}\sigma_{j}}exp(-\frac{(x_{j}-\mu_{j})^{2}}{2\sigma_{j}^{2}}) \end{aligned}$