无监督学习（unsupervised learning） 1.线性方法

最新推荐文章于 2024-08-22 22:53:18 发布

n不正

最新推荐文章于 2024-08-22 22:53:18 发布

阅读量2.8k

点赞数

分类专栏：李宏毅机器学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30981697/article/details/70185414

版权

李宏毅机器学习笔记专栏收录该内容

20 篇文章 0 订阅

订阅专栏

无监督学习（unsupervised learning） 1.线性方法

1 unspervised learning

Reduction(化繁为简)：Clustering & Dimension，只有输入
Generation(无中生有)：只有输出

2 Clustering

How many clusters？
K-Means：
- 将 $X = \{x_1, x_2, …,x_N \}$ 聚成K类
- 随机初始化聚类中心 $c_i,i=1,2,…,K$
- 对每一个 $x_n$ ，计算它离每一个聚类中心的距离 $b_n^i$ ，它离的最近的即为它的类
- 更新聚类中心： $c_i = \sum \limits_{x_n}b_n^ix_n / \sum\limits_{x_n}b_n^i$
- 重复以上几步
Hierarchical Agglomerative Clustering （HAC）
- step 1：build a tree，两两算相似度，相似度最大的两个合并，重复……
- step 2：pick a threshold，切分K类

3 dimension reduction

Distributed Representation：每个对象使用一个向量表示，而不仅仅是一个类
MNIST：描述一个数字不需要28*28的向量
Feature Selection：
Principle component analysis（PCA）： $z=Wx$ ，线性降维
- 投影得到的z越大越好
- 投影到d维， $w_1,…,w_d$ 相互正交， $W = [w_1,…,w_d]$ 为正交矩阵
- $z_1 = w_1x, \bar z_1 = w_1 \bar x$
- $Var(z_1) = \sum\limits_{z_1}(z_1-\bar z_1)^2 = w_1^T\sum(x-\bar x)(x-\bar x)^T w_1 = w_1^TCov(x)w_1 = w_1^TSw_1$
- 找到 $w_1$ 使得 $w_1^TSw_1$ 达到最大，且 $w_1^Tw_1=1$
- 使用Lagrange multiplier： $g(w_1) = w_1^TSw_1-\alpha (w_1^Tw_1-1)$ ，求偏导数得 $Sw_1 = \alpha w_1$ ， $w_1$ 即为S的特征向量。 $w_1^TSw_1= \alpha$ ， $\alpha$ 即为S的最大的特征值。
- 找到 $w_1$ 使得 $w_1^TSw_1$ 达到最大，且 $w_1^Tw_1=1,w_2^Tw_1=0$
- ……解得 $\beta = 0$ ， $w_2$ 是第二大的特征值对应的特征向量。
- ……
- $cov(z) = WSW^T = [\lambda_1 e_1,…,\lambda_K e_K ]$

4 PCA——another point of view

$x - \bar x = c_1u_1+…+c_Ku_K = \hat x$
Reconstruction error： $L = \mathop{min}\limits_{ \{ u_1,…,u_K\}} =\sum||(x-\bar x)- (\sum\limits_{k=1}^Kc_ku_k)||_2$
SVD分解： $X_{m*n} = U_{m*k}\sum_{k*k} V_{k*n}$
LDA：考虑labelled data的降维（监督）
PCA的弱点：1、unsupervised；2、linear
需要多少principle components？

计算每个特征值的ratio

5 Non-negative matrix factorization

NMF非负矩阵分解，所有的参数和component均为非负
minimize error： XM∗N≈AM∗KBK∗N
- $L = \sum\limits_{(i,j)}(r_ir_j-n_{ij})^2$ ，不考虑缺失的数据
- 用于推荐系统(Recommender systems)
- $\rightarrow L = \sum\limits_{(i,j)}(r_ir_j +b_i + b_j - n_{ij})^2$
- 应用：Latent Semantic Analysis 潜语义分析LSA
- 应用：Latent Dirichlet allocation 主题模型LDA

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。