山大公开课——高通量测序1

最新推荐文章于 2021-01-24 13:58:59 发布

weixin_42953727

最新推荐文章于 2021-01-24 13:58:59 发布

阅读量429

点赞数

分类专栏： bioinformatics 文章标签：生物信息学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42953727/article/details/102458875

版权

本文探讨了高通量测序的偏差和错误，包括454和Illumina平台的问题及解决策略。此外，讨论了速度、内存需求以及数据存储和可视化面临的挑战。在de novo测序、转录组学、重测序和表观基因组学等领域，阐述了各自独特的难题。猛犸象基因组测序计划作为实例，展示了古基因组学的挑战，如DNA损伤和环境污染。

摘要由CSDN通过智能技术生成

Sequencing bias/errors

1. 产生原因
454：识别不同荧光信号，不易区分homopolymer
Illumina：当分子簇形成数量较少时，不能灵敏地捕获荧光信号；及信号冲突，对于High GC区域的覆盖度比较低。
2. 解决方法（Correcting errors in short reads by multiple alignments/ Quake: quality-aware detection and correction of sequencing errors/ ECHO: A reference-free short-read error correction algorithm）
（1）Deep sequencing
（2）Statistical evaluation
（3）Error correction

Speed and RAM

高通量数据分析通常需要多个计算节点（CPU-intensive jobs: read mapping, metagenomics）和大的内存（RAM-intensive jobs：genome assembly），CPU访问内存速度比硬盘快得多，若拼接一个人的基因组，约需要512G的内存。
Performance in amazon EC2（http://bowtie-bio.sorceforge.net/crossbow）
Serchi

最低0.47元/天解锁文章

weixin_42953727

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

weixin_42953727 CSDN认证博客专家 CSDN认证企业博客

码龄6年

38: 原创

6万+: 周排名

102万+: 总排名

6万+: 访问

: 等级

1007: 积分

224: 粉丝

90: 获赞

17: 评论

289: 收藏

私信

关注

热门文章

分类专栏

最新评论

Bioinformatics Data Skills by Oreilly学习笔记-6
柯邦文: 干脆全英文了，懒得解释了
生信小白学习日记Day7——WGS分析流程（picard）
like rainbows: java -jar GenomeAnalysisTK.jar Error: Unable to access jarfile GenomeAnalysisTK.jar 博主你好，出现这种情况应该怎么解决呀
生信学习网站推荐
weixin_42953727: 谢谢，一起加油！
生信小白学习日记Day7——WGS分析流程（picard）
weixin_42953727: 可以参考这篇 https://www.cnblogs.com/lyyao/p/9789785.html 去重复的过程是给这些序列设置一个flag以标志它们，方便GATK的识别。还可以设置 REMOVE_DUPLICATES=true 来丢弃duplicated序列。对于是否选择标记或者删除，对结果应该没有什么影响，GATK官方流程里面给出的例子是仅做标记不删除。这里定义的重复序列是这样的：如果两条reads具有相同的长度而且比对到了基因组的同一位置，那么就认为这样的reads是由PCR扩增而来，就会被GATK标记。
生信小白学习日记Day7——WGS分析流程（picard）
gangjinga: REMOVE_DUPLICATES 不应该是 true吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。