机器学习与深度学习系列连载: 第一部分 机器学习(十四)非监督度学习-1 Unsupervised Learning-1

非监督度学习-1 Unsupervised Learning-1(K-means,HAC,PCA)

非监督学习方法主要分为两大类

  • Dimension Reduction (化繁为简)
    在这里插入图片描述
  • Generation (无中生有)
    在这里插入图片描述
    目前我们仅专注化繁为简,降维的方法,无中生有(GAN为代表的)方法,以后关注。
    在这里插入图片描述

1. Clustering

• K-means 算法
经典的非监督根据距离分类算法:
在这里插入图片描述

  • Hierarchical Agglomerative Clustering (HAC)
    根据数据两两间的相似度,进行建立一棵树,进行分类
    在这里插入图片描述

2. 分布的重表示 Distributed Representation

在这里插入图片描述

我们主要介绍Principle Component Analysis(PCA):
需要找到W, ? = ? ? ? = ?? z=Wx 降低维度到 1-D:

(1)线性代数表示
在这里插入图片描述
使得投影的结果的方差最大化
在这里插入图片描述
多维度投影中w1和w2是正交的
在这里插入图片描述
数学化证明,PCA与协方差有关 最大化 ( w 1 ) T c o v ( x ) w 1 (w^{1})^{T} cov(x)w^{1} (w1)Tcov(x)w1
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
因为S是对称矩阵,是半正定,特征值非负。使用拉格朗日乘子法:
在这里插入图片描述
在这里插入图片描述
w 1 w^{1} w1是特征向量, λ 1 \lambda_{1} λ1是最大的特征值
同理:
在这里插入图片描述
w 2 w^{2} w2是特征向量, λ 2 \lambda_{2} λ2是第二大的特征值

PCA去相关性举例:
在这里插入图片描述
在这里插入图片描述
(2)另一种视角看PCA
举例:手写数字是由基本的图片元素组成
在这里插入图片描述
那么7是由以下图片元素组成
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
我们有:
在这里插入图片描述
在这里插入图片描述
PCA可以看看做是特殊的神经网络,元素间是正交的
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值