课程笔记——Unsupervised Learning：Linear Methods

最新推荐文章于 2022-01-12 16:50:52 发布

mintminty

最新推荐文章于 2022-01-12 16:50:52 发布

阅读量445

点赞数 1

分类专栏：模型原理笔记

本文链接：https://blog.csdn.net/mintminty/article/details/93316174

版权

9 篇文章 0 订阅

订阅专栏

1 Unsupervised Learning作用

Clustering & Dimension Reduction(化繁为简)：将复杂的输入转化输出为简单内容，如输入一组树的图片输出一颗抽象的树图片。
Generation(无中生有)：输入特定值，通过已知的function输出不同类型的树图片。

本课时重点在于线性问题中的Dimension Reduction。

方法1：K-means

做法：

方法2：Hierarchical Agglomerative Clustering(HAC)层次聚类

做法：

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
注意：主成分研究并非简单的剔除特征，而是将高纬度特征映射成低维度，映射得到的低维度特征(能够较好代表原来的高纬度特征)为主成分。

直观看到特征聚集在某一维度，则直接提取该维度。(实际操作有困难)

$z = W x$ 关键是找到 $W$

例子：宝可梦横轴：攻击力，纵轴：防御力，现将其降维至一个维度。要点如下：

若将 $x$ 降维至两个维度，则：

预备：
在这里插入图片描述
投影到1维：

投影到1维：

目标：找到 $w^2$ ，使 $Var(z_2)=(w^2)Sw^2$ 最大
约束： $w^2)^Tw^2=1$ ， $w^2)^Tw^1=0$
朗格朗日乘法，得：（蓝色线处=1，黄色线处=0，绿色线处=行向量*矩阵*列向量=标量）
结论： $w^2$ 是协方差矩阵 $S$ 的特征向量(对应的特征值 $\lambda_2$ 为第二大的特征值。解释：因为两个特征向量是正交的，故特征值一定不同，所以 $w^2$ 特征值一定不是最大的那个，那么顺延即为第二大)

关注

专栏目录