模式识别-高维空间降维的重要性

DX_dove

于 2017-11-01 12:41:25 发布

阅读量3.1k

点赞数

分类专栏：机器学习模式识别文章标签：模式识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CV_YOU/article/details/78412800

版权

机器学习同时被 2 个专栏收录

20 篇文章

订阅专栏

2 篇文章

订阅专栏

今天上了一节模式识别课，老师讲了几个结论，关于高维空间降维的重要性：

1.通过公式的推导（这里就不推导了），会发现高维度空间的体积主要分布在壳部和角部。

2.随着维度的增加，体积（Vc（正方形），Vr（圆形））会迅速增加。这样的好处是在样本空间，样本的分布会非常稀疏，不易重叠，利于分类。
然后老师又说了一句话：对高维进行概率密度函数设计特别困难，设计分类器也很困难，所以降维是必须的。
这里的理解是，对于高维空间，人为的靠感觉设定一个超平面是可以的，但是要通过计算机计算设定一个超平面，是很困难的，因为概率密度函数不好的设计，所以要降维。

3.高维度空间样本分布稀疏，导致同类样本分布相对集中，落在一个较低的子空间中，利于投影，不会导致信息丢失。

4.高维度空间的数据抓哟分布在壳部和角部，不是均匀分布在整个空间中。

5.根据中心极限定理，高维空间的数据投影到很低维度的空间中，数据将会呈现正态分布。所以，说降维是对分类有效的。

6.根据一个人fakanage的实验结论：
对于监督分布，设计分类器所需要的样本数量于空间的维度呈现正比例关系。
对于非监督分布，设计分类器所需要的样本数量于空间的维度呈现指数关系。
这就解释了，神经网络的隐藏层的数量不是越多越好，而是要有足够的数据样本作为支持才行。

还有对于高维度空间投影理解：就是让投影的坐标轴为0.

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。