RNAseq偏差基础知识汇总

最新推荐文章于 2021-10-14 10:20:44 发布

wangyiqi806643897

最新推荐文章于 2021-10-14 10:20:44 发布

阅读量556

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangyiqi806643897/article/details/105482331

版权

纯粹自我理解，参考一些论文概念后的心得，如果不对，感谢大神指点，不胜感激

1、是什么

其实就是测序所得数据与实际序列结果有一定成都偏离；

2、为什么

高通量测序，海量的数据，系统噪声，数据偏差；

位置偏差 的产生是因为测序片段倾向于来自转录本的起始位置，而 序列偏差 通常是因为测序片
段的序列信息会影响测序抽样过程。这两种偏差被认为是已知偏差类型中最重要的组成部
分

举个栗子下图基因ENSG00000154146和ENSG00000131095的读段分布具有明显的非均勻性质。读段的非均匀分布通常是由数据中不同偏差造成的，比如5端和3段的位置偏差，GC碱基偏差以及其他技术性偏差

3、怎么办

针对此问题，不同方法采用了不同策略来消除偏差对表达水平估计的影响。NURD使用非参数模型估计全局偏差曲线和局部偏差曲线，分别代表读段位置偏差对全部基因和基因内剪接异构体的影响，其定量值被当做权重嵌入到泊松分布中。mseq通过线性模型来预测每个碱基位置周围序列的影响。POME方法考虑了碱基的变异性和碱基之间的相关性。在实际数据中，读段的非均匀分布通常是由各种偏差共同影响的，因此在表达水平估计中需要考虑更加复杂的偏差类型。

wangyiqi806643897

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RNAseq偏差基础知识汇总

纯粹自我理解，参考一些论文概念后的心得，如果不对，感谢大神指点，不胜感激1、是什么其实就是测序所得数据与实际序列结果有一定成都偏离；2、为什么高通量测序，海量的数据，系统噪声，数据偏差；位置偏差的产生是因为测序片段倾向于来自转录本的起始位置，而序列偏差通常是因为测序片段的序列信息会 ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。