Title:A Variational Information Bottleneck Approach to Multi-Omics Data Integration
Summary
- 论文提出使用变分信息瓶颈的方法对于不完整的多视图数据进行融合表征学习,设计了“单个视图编码器”、“多视图融合器”、“单视图预测器”和“多视图预测器”来构建整个模型。其中最关键的多视图融合器利用单视图的概率分布乘积来定于融合分布。
Problem Statement
- 现有的大多数多视图方法都是基于完整的视图来做的,即多视图数据中每个视图都是独立完整的,而现实生活中的各种多视图数据往往是不完整的,是有视图缺失的,因此需要构建一个能够处理缺失信息的多视图处理模型。
Method
- 不完整多视图数据处理问题的定义:从不完整的多视图数据中学习得到高效的表征,用于后续的分类和回归任务。
- 模型的主成部分:
- 对于公共空间表征和单个视图的表征进行应用信息瓶颈:
- 模型最终的损失函数:
- 论文完整的模型图:
Evaluation
- 基于不同视图数量下进行了相关的实验
- 基于完整视图和不完整视图的情况下进行了对比实验
- 评估指标是ROC曲线的面积
Conclusion
- 通过信息瓶颈以及分布乘积融合的过程可以学习得到多视图的高效潜在表征,使得模型在视图缺失的情况下依旧保持较高的测试水平。
Notes
- This is challenging because i) complex interactions within and across observed views need to be properly addressed for optimal predictive power and ii) observations with various view-missing patterns need to be flexibly integrated.
- Multi-view: genomics, epigenomics, transcriptomics, proteomics, and metabolomics.
- Complete Multi-View Observations. To utilize information across multiple views, a variety of methods
have been proposed in recent years. - The presence of missing views remains an inevitable and prevalent problem in multi-omics data integration.
References
- NEMO: Cancer subtyping by integration of partial multi-omic data.
- The information bottleneck method.
- On deep multi-view representation learning.
- Deep multi-view information bottleneck.
- Training products of experts by minimizing contrastive divergence.
- Learning robust representations via multi-view information bottleneck.
To Myself
- 计算机三级Linux成绩的不及格好像成了我的阴影,虽然一直都是和自己说失败是难免的,但是好多时候自己就是差那么一点的努力,很难真正的静下心来去做好一件事。考试已经结束成绩也是已经出了,以前的事情没办法改变,重要的是以后应该怎么办吧。或许吧,一切都是冥冥之中自有定数的。我只是我,别人怎么看都无所谓的,只要自己对得起天,对得起地,对得起自己,那也就问心无愧了。想起了之前的各种座右铭,生活没有那么难,我要向你挑战。
- 就算没有人为我鼓掌,我也要勇敢的自我欣赏。
- 天生我材必有用,千金散尽还复来。
- 不以物喜,不因己悲,做一个真实的自己。
- 得失萦怀功难成。
- 努力做最好的自己。
- 自觉,自律,自信。
- 生活,我向你挑战