MIT-6874-Deep Learning in the Life Sciences Week 8


gene expression and splicing)


前言

本节课将带来基因表达和剪切相关内容的学习,首先介绍了基因测序以及表达的基本概念,并粗浅的介绍了深度学习可以做的事


提示:以下是本篇文章正文内容,下面案例可供参考

0. Intro: Expression, unsupervised learning, clustering

基因测序是怎么做的:
在这里插入图片描述
基因测序之后就可以得到基因表达阵列,并可以对其进行分析
每一行代表不同的基因,每一列对应着不同的实验条件(如不同的组织细胞/不同疾病/不同人群/以及等等其他)

  • 对于每行数据,你可以看到同一个基因在不同实验下的差异表达
  • 对于每列数据,你可以看到不同试验下,整条基因组的差异
    在这里插入图片描述
    对于基因测序数据,存在着很多潜在的任务,最典型的就是 聚类分类 两种问题
  • Clustering【无监督学习】: 具有相似功能的基因表达往往会富集在一处,因此也揭示了潜在的结构
  • Classification【监督学习】: 从数据中提取特征,并且强制机器去学到这些不同类别之间数据特征的差异
    在这里插入图片描述

常用的降维方法及其效果的差异:

对比一下不同降维方法之间的差异:(mnist, 手写数据)
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述


1. Up-sampling: predict 20,000 genes from 1000 genes

上采样于基因表达的应用:如何用一个基因子集预测2w个基因。
Challenge: Measure few values, infer many values
在这里插入图片描述
在这里插入图片描述
谢晓辉
在这里插入图片描述


2. Compressive sensing: Composite measurements

第二种方式,通过建立复杂的测量(除测量基因的一个子集之外,还会通过探针组合建立综合测量,共同捕获基因的综合表达)
在这里插入图片描述
在这里插入图片描述


3. DeepChrome+LSTMs: predict expression from chromatin

从染色质预测基因表达

什么是染色质?
染色质(chromatin)最早是1879年Flemming提出的用以描述核中染色后强烈着色的物质。现在认为染色质是细胞间期细胞核内能被碱性染料染色的物质。染色质的基本化学成分为脱氧核糖核酸核蛋白,它是由DNA、组蛋白、非组蛋白和少量RNA组成的复合物。用于化学分析的原核细胞的染色质含裸露的DNA,也就是不与其他类分子相连。

Predicting Reporter Expression from Chromatin Features

这一部分由耶鲁大学的嘉宾讲解:Guest Lecture: Flynn Chen, Mark Gerstein Lab, Yale
DECODE——使用弱监督方法精准预测增强子的位置
在这里插入图片描述
什么是增强子?

  • 增强子是一种调节元件,可以增加特定基因的转录
  • 绘制出细胞类型的特定调控景观,使我们能够找到各种疾病的基因驱动因素。
  • 最早的增强子发现方法,如ChromHMM,专注于无监督方法
    在这里插入图片描述
    实验的方法:
  • 直接通过活动强度识别转录增强子
  • 存在问题:转染效率低,分辨率低,评估片段脱离表观遗传背景
    在这里插入图片描述
    因此作者提出了一种建立在这样假设前提条件下的方法:开放染色质和组蛋白标记之间的相互作用为TF结合和增强子活性提供了平台
    关注以下五种细胞系
    在这里插入图片描述
    并巧妙的将增强子的定位问题转化为目标检测问题的处理思想
    在这里插入图片描述
    结合弱监督学习的思想:我们只知道图片上有“狗”/“猫”,但是我们并不知道它们具体在图片中的位置。
    这和寻找增强子位置面临的问题相同:即我们仅有大致的位置和粗糙的标签——我们想仅利用这些信息就能精准定位到增强子的具体位置
    在这里插入图片描述

4. Guest Lecture: Xiaohui Xie, UC Irvine

• Predicting Gene Expression from partial subsets sampling
• Representation learning for multi-omics integration

生物领域的数据蓬勃增长
在这里插入图片描述
Xie致力于研究用于单细胞多组学研究的多模态机器学习
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


5. Guest Lecture: Kyle Kai-How Farh, Illumina

• Predict splicing from sequence
我们对基因的认识才刚刚开始
在这里插入图片描述
SpliceAI可解读罕见和未确诊疾病中的非编码突变
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值