BWA处理WES文件

BWA处理WES文件的用法及注意事项

1. 构建索引

bwa index -a bwtsw hg38.fa

构建索引时需要注意的问题:bwa构建索引有两种算法,两种算法都是基于BWT的,这两种算法通过参数-a is 和-a bwtsw进行选择。其中-a bwtsw对于短的参考序列是不工作的,必须要大于等于10Mb;-a is是默认参数,这个参数不适用于大的参考序列,必须要小于等于2G。
整个过程会得到5个文件hg38.fasta.amb、hg38.fasta.ann、hg38.fasta.bwt、hg38.fasta.pac、hg38.fasta.sa
耗费时间较长,可以放到回台运行

nohup  bwa index -a bwtsw hg38.fa &

2. 比对

比对时,用mem算法进行比对

bwa mem -t 4 -M -R '@RG\tID:SRR3023080\tSM:SRR3023080\tPL:Illumina'  索引路径/索引前缀 SRR3023080_1.fastq.gz SRR3023080_2.fastq.gz >SRR3023080.sam 

-t参数,线程数;-R参数(-R ‘’,引号一定要加,不加会报错的,这都是我踩过的坑啊):设置reads标头,“\t”分割;M——将较短的split hits标记为secondary,与picard兼容;后边跟参考基因组(一定要给前缀)、reads文件和>以及要生成的sam文件。(如果GATK call SNP 必须用-r 参数)
得到sam文件后,用samtools工具转成bam文件,bam文件是sam文件的二进制格式,占的内存小。

samtools view -b -S SRR3023080.sam > SRR3023080.bam

参考链接:https://www.jianshu.com/p/f6da985913c4
参考链接:https://www.plob.org/article/7009.html
参考链接:https://www.bioinfo-scrounger.com/archives/181/

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值