unsupervise learning-dimension reduction

PCA

在这里插入图片描述
目标是找到一个向量w1,所有数据点x在w1上的投影,得到z1,希望得到z1的方差越大越好,即越分散越好,越分散越有利于进行数据的分类
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
PCA缺点:由于是非监督学习,在确定向量时,希望所有数据投影到向量上的值为离散值,但是由于数据没有label,如果数据为两个分类,那么经过降维之后,数据会混在一起无法分别
是线性(linear)模型,在进行数据降维时有些数据高维数据经过投影会混在一起。如上图右上角的数据集合,希望能把S型数据拉平,但PCA是线性模型,经过PCA降维后,数据会变成又下角的样子,即打扁被降维。

PCA并没有要求特征值为正,这样观察得到的特征向量,可解释性并不强,为了增强其可解释性,可以强制要求特征值为正,这就是非负矩阵分解(NMF)

Matrix Factorization

详细原理参见
Matrix Factorization 学习记录(一):基本原理及实现

Word Embedding

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

详细原理参见
Word Embedding 知识总结

t-SNE

详细原理参见
t-SNE的通俗易懂解释

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值