AML 3

最新推荐文章于 2024-01-08 20:58:59 发布

panthera_1

最新推荐文章于 2024-01-08 20:58:59 发布

阅读量259

点赞数

分类专栏： LAMP 文章标签：降维 PCA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/panthera_1/article/details/84259422

版权

LAMP 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

第十章降维与度量学习

K近邻学习器（k-Nearest Neighbor，kNN）

是懒惰学习（lazy learning）的代表投票法、平均法

最近邻学习器和贝叶斯最优分类器：给定的测试样本x，若其最近邻样本为z，则其最近邻分类器出错的概率就是x和z类别标记不同的概率。

Perr=1-c∈YPcxPcz.

维数灾难 高维空间给距离计算带来很大的麻烦。

在高维情形下出现的数据样本稀疏、距离计算困难等问题。

一个方法是降维。

多维缩放方法（Multiple Dimensional Scaling，MDS）寻找一个低维子空间，样本在此空间内的距离和样本原有距离尽量保持不变。

主成分分析（Principal Component Analysis，PCA）

最常用的一种降维方法。正交属性空间中的样本点，如何使用一个超平面对所有样本进行恰当的表达？超平面需要有两个性质：1.最近重构性：样本点到这个超平面的距离都足够近2.最大可分性：样本点在这个超平面的投影能尽可能分开。

PCA应用。d'的设置：用户指定；在低维空间中对k近邻或其他分类器进行交叉验证；设置重构阈值。PCA 是最常用的降维方法，在不同领域有不同的称谓。人脸识别中该技术称为“特征脸”。

非线性降维：核化线性降维KPCE,KLDA；流形学习（manifold leaining）

核化PCA 首先对PCA解的结构进行分析(i=1mziziT)W=λW

W=1λ(i=1mziziT)W=i=1mziziTWλ=i=1mziαi

假定zi是由原始属性空间中样本点通过映射ϕ产生，

即zi=ϕxi,i=1,2,…,m。于是有(i=1mϕxiϕxiT) W=λW

W=i=1mϕxiαi

令κxi,xj=ϕxiTϕ(xj)可得KA=λA,A=(a1,a2,…)

取K中最大的d’个特征值，得到zj=wjTϕx=i=1mαijϕxiTϕx=i=1mαijκ(xi,x)

流形学习（ISOMAP）

…

距离度量学习

…

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

panthera_1 CSDN认证博客专家 CSDN认证企业博客

码龄9年

11: 原创

126万+: 周排名

217万+: 总排名

5398: 访问

: 等级

165: 积分

0: 粉丝

4: 获赞

1: 评论

4: 收藏

私信

关注

热门文章

分类专栏

LAMP 11篇

最新评论

SWIM论文
长帆QAQ: 博主你好，我想问一下，这篇19年发表的论文，为什么你在18年12月就写了这篇文章？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。