UA MATH567 高维统计IV Lipschitz组合8 随机投影与John-Lindenstrauss引理

最新推荐文章于 2022-06-21 13:00:00 发布

VIP文章一个不愿透露姓名的孩子

最新推荐文章于 2022-06-21 13:00:00 发布

阅读量302

点赞数 1

分类专栏： # 高维统计文章标签：机器学习概率论

本文链接：https://blog.csdn.net/weixin_44207974/article/details/112167504

版权

UA MATH567 高维统计IV Lipschitz组合8 随机投影与John-Lindenstrauss引理

- John-Lindenstrauss引理
- Random Projection

John-Lindenstrauss引理

这一讲我们介绍一个Lipschitz函数法处理随机向量的技术的应用。假设在一个机器学习问题中，我们有 $N$ 个样本，每个样本有 $n$ 个feature，但是 $n$ 非常大，直接用这么多feature训练模型不但浪费算力而且影响模型精度，所以我们想做一个投影 $P$ ，把这组 $n$ 维的feature投影到一个 $m$ 维的子空间，我们希望投影前后任意两个样本点的差别不会被放大或者缩小，用数学来描述就是假设 $x, y$ 这两个 $n$ 维向量分别表示一个样本，则给定一个很小的正数 $\epsilon$ ，使得
$(1-\epsilon)\left\| x-y \right\|_2 \le\left\| Px-Py \right\|_2 \le (1+\epsilon)\left\| x-y \right\|_2$

其中 $\in \mathbb{R}^m$ ，站在理论机器学习研究者的角度，我们比较关心的一个问题是最小能把feature的维数压缩到多少？J-L引理认为基于Haar测度的随机投影下最小的维数是 $O(\ln N)$ 。

John-Lindenstrauss引理
用 $\mathcal{X}$ 表示 $N$ 个样本， $\mathcal{X} \subset \mathbb{R}^n$ ， $\forall \epsilon>0$ ， $\exists C>0$ , $\forall m \ge (C/\epsilon^2) \log N$ ，如果 $\sim Unif(G_{n,m})$ ，存在random projection
$\sqrt{\frac{n}{m}}P_E$

使得下面的事件概率不小于 $1-2e^{-c\epsilon^2m}$ ：
$(1-\epsilon)\left\| x-y \right\|_2 \le\left\| Qx-Qy \right\|_2 \le (1+\epsilon)\left\| x-y \right\|_2$

最低0.47元/天解锁文章

一个不愿透露姓名的孩子

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
3
评论
UA MATH567 高维统计IV Lipschitz组合8 随机投影与John-Lindenstrauss引理

UA MATH567 高维统计IV Lipschitz组合8 随机投影与John-Lindenstrauss引理这一讲我们介绍一个Lipschitz函数法处理随机向量的技术的应用。假设在一个机器学习问题中，我们有NNN个样本，每个样本有nnn个feature，但是nnn非常大，直接用这么多feature训练模型不但浪费算力而且影响模型精度，所以我们想做一个随机投影PPP，把这组nnn维的feature投影到一个mmm维的子空间，我们希望投影前后任意两个样本点的差别不会被放大或者缩小，用数学来描述就是假设x
复制链接

扫一扫