UFLDL上的ICA为什么一定要做PCA whiten

最新推荐文章于 2020-04-04 20:48:13 发布

happynear

最新推荐文章于 2020-04-04 20:48:13 发布

阅读量4.3k

点赞数 1

分类专栏：深度学习文章标签： deep-learning ICA PCA白化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/happynear/article/details/44630041

版权

深度学习专栏收录该内容

8 篇文章 3 订阅

订阅专栏

　　Andrew Ng先生的UFLDL教程真可谓deep learning入门的首选课程。在两年前我看教程里讲ICA部分的（链接）时候，里面提到使用教程所述的ICA模型时，输入数据必须经过PCA白化操作，页面上有个TODO问为什么要这样做。以当年的我对机器学习的理解并不能解答这个问题，就只是按照教程上讲的写完了代码，后来就一直没有看过了。
　　今天在与人讨论无监督学习的几种损失函数的时候，提到了PCA的损失函数：

max ∥ W x ∥ 2 s . t . W W T = I,

$\max \|Wx\|_2 \quad s.t. WW^T=I,$
优化这个方差，就可以得到最大化方差的解。其中，

W $W$ 是个扁矩阵，以起到降维的作用。我们都知道，这个优化式可以通过svd求解：

W=USV $W = USV$ ，取

U $U$ 的前几列，即可得到降维用的旋转矩阵，而最后几个奇异值，对应

U $U$ 的最后几列，一般都会是接近0的数，是要丢掉的。
　　这时，我突然想起来，为什么ICA的损失函数会使用min函数：

min ∥ W x ∥ 1 s . t . W W T = I .

$\min \|Wx\|_1 \quad s.t. WW^T=I.$
　　要知道

ℓ1 $\ell 1$ 范数和

ℓ2 $\ell 2$ 范数的差别确实有，但并不是那么明显，如果使用min函数的话，岂不是找到了没有数据的那些子空间去了？
　　于是我就去翻了下教程，原来这里需要先对

x $x$ 做PCA白化，先取到

x $x$ 的方差较大的几维子空间，再在这上面做最小化操作，如果把这里的

ℓ1 $\ell 1$ 范数换为

ℓ2 $\ell 2$ 范数，得到的实际上就是

U <script type="math/tex" id="MathJax-Element-37">U</script>的中间几列。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。