【论文笔记】Hybrid Subspace Learning for High-Dimensional Data

最新推荐文章于 2023-12-18 20:49:48 发布

yuukilp

最新推荐文章于 2023-12-18 20:49:48 发布

阅读量440

点赞数 1

分类专栏：数据降维 papers notes 论文笔记文章标签： high dimension feature selcetion PCA machine learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014686462/article/details/83652672

版权

论文链接：Hybrid Subspace Learning for High-Dimensional Data

1. Abstract

真实世界中，高维数据是一个非常普遍的问题。在高维空间中学习一个紧的，低维子空间的数据表达有助于区分信号和噪声。PCA方法是假设数据是可以被一个或多个隐藏的子空间的嵌入来表达。但是，在许多高维数据中，这种处理方法是不合适的。常常是只有某些变量可以经过线性转换投影到低维空间。论文提出了一种混合的降维技巧：部分变量投影到低维子空间，另外一部分变量保留。文章提出的模型能够更加准确地估计隐藏空间，并且有较低的恢复误差。

2. Introduction

高维数据经常出现在生物医学中，比如基因表达数据（每个人基因表达数据的测量耗费较大）。一些传统的机器学习算法缺失有效的统计性能去区分信号和噪声。

缓和维度灾难的方法包括提取原始特征中的一个子集，或者学习一个新的子空间（原始特征空间的投影）。论文提出的方法主要是学习数据在隐藏子空间的表达，这个表达能够最大程度的原始数据的信息。

现存的子空间学习方法最大的限制在于它们假设数据可以通过嵌入一些低维子空间来完全表示。真实世界中，可能只有某个特征子集才会呈现出低维空间结构，而其余的特征仍然保留，而并非全部特征。显然，如果某些特征 ${F_i\}$ 与其它特征完全不相关，而使用降维算法在学习潜在子空间时，子空间的每个维度都会带有 ${F_i\}$ 。事实上，这个特征集 ${F_i\}$ 不应该带入潜在子空间的学习上。

如下图Fig1，两幅图都呈现出2维的子空间结构，但是第一幅图的2维子空间每个维度都是 ${x_1,x_2,x_3}$

最低0.47元/天解锁文章

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
【论文笔记】Hybrid Subspace Learning for High-Dimensional Data

论文链接：Hybrid Subspace Learning for High-Dimensional Data1. Abstract2. Introduction3. Motivation4. Model5. Optimization6. Data experiments
复制链接

扫一扫

专栏目录

yuukilp CSDN认证博客专家 CSDN认证企业博客

码龄10年

207: 原创

7万+: 周排名

35万+: 总排名

26万+: 访问

: 等级

4579: 积分

83: 粉丝

80: 获赞

53: 评论

370: 收藏

私信

关注

热门文章

分类专栏

最新评论

使用深度学习进行生存分析
WIXBC: 请问您下载了吗？我也不会下载，小白太难了
使用深度学习进行生存分析
Z09872473: 我最近在复现这个，但是这个库根本就下载不上啊🥹
【论文笔记】CatBoost: unbiased boosting with categorical features
小凉爽&玉米粒: 楼主，我看论文理解了Order TS和Order boosting的意思，但是把他们一起整合到算法2 Building a tree in CatBoost之后的伪代码，我有点看不懂，想问一下您可以帮忙解答一下吗？
【论文笔记】CatBoost: unbiased boosting with categorical features
JavaExploit: 楼主你好，您所分享的文章对我的帮助非常大，非常感谢您的分享，同时在学习的时候，对于Building a tree in catboost伪代码中的一些符号所代表的意思不理解，比如：α、L、grad、leafr(i) ← GetLeaf(xi, Tc, σr) for i = 1..n;∆(i) ← avg(gradr(p) for p : leafr(p) = leafr(i)) for i = 1..n;希望楼主能得到楼主的解惑，非常感谢！
使用深度学习进行生存分析
Rain_Hpu: 那如果在t时刻，有多个人同时死亡，也可以用这个计算风险概率吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。