重测序变异检测与注释

最新推荐文章于 2023-12-05 15:07:20 发布

舞扬澜

最新推荐文章于 2023-12-05 15:07:20 发布

阅读量558

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/weixin_42930149/article/details/107704477

版权

2 篇文章 0 订阅

订阅专栏

本文介绍了生物信息学中下机数据的质量控制流程，包括使用FastQC进行质量检查和SOAPnuke进行过滤。FastQC用于评估测序数据的质量，而SOAPnuke则用于去除接头序列和低质量reads，设置了质量阈值、线程数等参数。通过这些步骤，确保后续分析的数据可靠性。

摘要由CSDN通过智能技术生成

质量控制, -t是使用两个线程
fastqc XXX.fq.gz -o ./ -t 2
过滤工具一： SOAPnuke
SOAPnuke filter -1 AAA.fq.gz -2 BBB.fq.gz -C CCC.fq.gz -D DDD.fq.gz -f 接头序列 -o 目录 -I （质量阈值）12 -q 0.1 -n 0.01 -Q 2 -G 2 -5 0 -T 4 -M1
-q 低质量碱基占10%即认为该reads为低质量reads
-Q 质量平台 -G 输出质量平台
-T 4个线程 -5 0表示老数据，以2结尾的数据 -5 1表示新数据
提取基因组特定位置序列 samtools faidx reference.fa chr1:106132-10494> xx.fa