RNAseq偏差基础知识汇总

纯粹自我理解,参考一些论文概念后的心得,如果不对,感谢大神指点,不胜感激

1、是什么

其实就是测序所得数据与实际序列结果有一定成都偏离;

2、为什么

高通量测序,海 量的数 据 ,系统噪 声 ,数据偏差;

位置偏差 的 产 生 是 因 为 测 序 片 段 倾 向 于 来 自 转 录 本 的 起 始 位 置 ,而 序 列 偏 差 通 常 是 因 为 测 序 片
段 的 序 列 信 息 会 影 响 测 序 抽 样 过 程 。这 两 种 偏 差 被 认 为 是 已 知 偏 差 类 型 中 最 重 要 的 组 成 部

举个栗子下图基因ENSG00000154146和ENSG00000131095的读段分布具有明显的非均勻性质。读段的非均匀分布通常是由数据中不同偏差造成的,比如5端和3段 的位置偏差,GC碱基偏差以及其他技术性偏差

3、怎么办

针对此问题,不同方法采用了不同策略来消除偏差对表达水平估计的影响 。NURD使 用 非 参 数 模 型 估计 全局 偏 差 曲 线和 局 部 偏 差 曲 线,分别代表读段位置偏差对全部基 因 和 基 因 内 剪 接 异 构 体 的 影 响 ,其 定 量 值 被 当 做 权 重 嵌 入 到 泊 松 分 布 中。mseq通过线性模型来预测每个碱基位置周围序列的影响。POME方法考虑了碱基的变异性和碱基之间的相 关 性。 在 实 际 数 据 中 ,读段的非均匀分布通常是由各种偏差共同影响的,因此在表达水平估计中需要考虑更加复杂的偏差类型。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值