西瓜书_chapter10_降维与度量学习

最新推荐文章于 2024-08-07 21:18:06 发布

lirt15

最新推荐文章于 2024-08-07 21:18:06 发布

阅读量379

点赞数

分类专栏：西瓜书笔记文章标签：降维学习机器学习

本文链接：https://blog.csdn.net/lirt15/article/details/94031315

版权

本文深入探讨了机器学习中的降维技术，包括k近邻学习的懒惰学习特性，低维嵌入如主成分分析（PCA）、核化线性降维和流形学习中的Isomap与LLE方法。同时，介绍了度量学习的概念，阐述了如何通过调整距离度量提升学习效果。

摘要由CSDN通过智能技术生成

10.1 k近邻学习(kNN)

给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后根据这k个邻居的信息进行预测
与前边的学习方法相比，kNN没有显式的训练过程，只有拿到测试样本以后才进行处理，我们将其称为懒惰学习(lazy learning)，而哪些再训练阶段就对样本进行处理的方法叫做急切学习(eager learning)
给定测试样本 $x$ ，若其最近邻样本为 $z$ ，则最近邻分类器出错的概率是二者类别不同的概率，我们假设两个样本独立同分布
$\begin{aligned} P(err) &=1-\sum_{c\in Y}P(c|x)P(c|z) \\ &\simeq 1-\sum_{c\in Y}P^2(c|x) \\ &\leq 1-P^2(c^*|x) \\ &=(1+P)(1-P) \\ &\leq 2\times (1-P(c^*|x)) \end{aligned}$
其中, $P(c^*|x)$ 表示贝叶斯最优分类器的结果。这表明最近邻分类器虽然简单，但是它泛化错误率不超过贝叶斯最优分类器的两倍

10.2 低维嵌入

我们首先介绍多维缩放算法(Multiple Dimensional Scaling,MDS)。
假定 $m$ 个样本再原始空间的距离矩阵为 $D\in \mathbb{R}^{m\times m}$ ，其中的元素 $dist_{ij}$ 为样本 $x_i$ 到 $x_j$ 的距离。我们的目标是获得样本在 $d^{'}$ 维空间的表示 $\mathbf{Z}\in\mathbb{R}^{d'\times m},d'\leq d$ ，且任意两个样本在 $d^{'}$ 维空间中的距离等于原始空间中的距离
我们令 $\mathbf{B}=\mathbf{Z}^T\mathbf{Z}\in \mathbb{R}^{m\times m}$ ，为降维后的内积矩阵， $b_{ij}=z_i^Tz_j$ ，则有
$dist_{ij}^2=b_{ii}+b_{jj}-2b_{ij}$
为了便于讨论，我们令降维后的样本 $\mathbf{Z}$ 被中心化，即 $\sum_{i=1}^{m}z_i=0$ ，矩阵 $\mathbf{B}$ 的行与列之和均为0，那么有
$\sum_{i=1}^{m}dist_{ij}^2=tr{\mathbf{(B)}+mb_{jj}} \\ \sum_{j=1}^{m}dist_{ij}^2=tr{\mathbf{(B)}+mb_{ii}} \\ \sum_{i=1}^{m}\sum_{j=1}^{m}dist_{ij}^2=2m tr{\mathbf{(B)}}$
在此基础之上
$dist_{i·}^2=\frac{1}{m}\sum_{j=1}^{m}dist_{ij}^2\\ dist_{·j}^2=\frac{1}{m}\sum_{i=1}^{m}dist_{ij}^2 \\ dist_{··}^2=\frac{1}{m^2}dist_{ij}^2$

最低0.47元/天解锁文章

lirt15

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
西瓜书_chapter10_降维与度量学习

10.1 k近邻学习(kNN)给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后根据这k个邻居的信息进行预测与前边的学习方法相比，kNN没有显式的训练过程，只有拿到测试样本以后才进行处理，我们将其称为懒惰学习(lazy learning)，而哪些再训练阶段就对样本进行处理的方法叫做急切学习(eager learning)给定测试样本xxx，若其最近邻样本为zzz，则最近...
复制链接

扫一扫

专栏目录