引言
关于无监督学习:
什么是cluster?
cluster的另外一种方法
我们今天主要讨论的是化繁为简
dimension reduction是啥
那么为什么dimension reduction会是有用的呢?
拿手写数字识别来说,我们原本的参数是28*28的pixel,但是有很多都是多余的,我们需要去繁化简,找到最主要的components
我们用distributed representation 而不是cluster
那我们如何去做distributed representation
PAC
这是我们今天介绍的主要方法
首先需要明白我们的目标是什么,我们希望var(z)越大越好
在多维空间上
运算推理
需要明白我们的目标和限制条件是什么
确立了目标,去找到w1
同样去找w2
PAC的去相关
另外一个角度去看PAC
我们需要去找到k个vector使差距越小越好
矩阵块的形式表示
会发现和之前的结果有很多相似的地方
虽然找到了w的值,但是对于不同的data,会有不一样的Ck值
得到一部分
对C2也进行同样的操作
宝可梦的例子
选择组成数量
一些描述
一些例子
手写数字
人脸
PAC的缺点
NMF
限制前提条件,使所有组件和它的加权值都必须是正的,所以图像都必须由组件叠加得到,上面的可以是相减得到
符合我们最开始得到一部分组件的想法
矩阵分解和推荐系统
链接:参考资料