利用bowtie2和samtools获得reads在基因集上的反贴率

mkdir /mnt/mzy/dairycow/72samples/mag/geneprofile
cd /mnt/mzy/dairycow/72samples/mag/geneprofile
for j in 123 98 126 4 128 32 134 8 130 29 131 42 119 19 139 24 125 37 144 14 117 5 142 13 127 22 129 48 138 47 140 20 132 18 149 73 120 105 148 44 122 30 124 26 143 34 133 12 145 21 152 10 118 102 147 80 121 1 151 35 135 38 136 2 150 17 146 55 141 11 137 97
do
bowtie2 -k 50 -p 88 -x /mnt/mzy/dairycow/24samples/mag/geneprofile/db/maggene -1 /data/72sample/sub72/DNA/$j.1.fq -2 /data/72sample/sub72/DNA/$j.2.fq >tmp.sam
samtools sort tmp.sam|samtools view -bS >tmp.bam && rm tmp.sam
samtools index tmp.bam
samtools idxstats tmp.bam >$j.DNA.abd && rm tmp.bam *bai
rm tmp.bam
done

for j in 123 98 126 107 128 32 134 8 130 29 131 42 119 108 139 24 125 37 144 83 117 5 142 74 127 22 129 81 138 99 140 20 132 82 149 73 120 105 148 44 122 101 124 100 143 76 133 12 145 79 152 77 118 102 147 80 121 106 151 104 135 38 136 2 150 78 146 55 141 11 137 97
do
bowtie2 -k 50 -p 88 -x /mnt/mzy/dairycow/24samples/mag/geneprofile/db/maggene -1 /data/72sample/sub72/RNA/$j.1.fq -2 /data/72sample/sub72/RNA/$j.2.fq >tmp.sam
samtools sort tmp.sam|samtools view -bS >tmp.bam && rm tmp.sam
samtools index tmp.bam
samtools idxstats tmp.bam >$j.RNA.abd && rm tmp.bam *bai
rm tmp.bam
done
 

Bowtie2是一个用于快速、内存高效地将短读序列与哺乳动物大小的基因组进行比对的工具。它使用的是基于FM-index的索引结构,能够有效地处理长度为20-200个碱基的DNA序列。Bowtie2支持单端和双端的比对,以及局部和全局的比对模式。 使用Bowtie2进行比对的基本步骤如下: 1. 首先,需要有一个基因组序列,并且需要构建一个索引文件,这是使用Bowtie2之前必须完成的一步。构建索引的命令格式如下: ``` bowtie2-build <reference_in> <bt2_index_base> ``` 其中 `<reference_in>` 是基因组的FASTA格式文件,而 `<bt2_index_base>` 是输出的索引文件的前缀名。 2. 构建索引后,就可以使用Bowtie2将序列读取与索引的基因组进行比对了。比对的基本命令格式如下: ``` bowtie2 -U <reads> -S <output_sam_file> ``` 在这里,`<bt2_index_base>` 是之前构建索引时指定的文件前缀,`<reads>` 是包含测序读数的文件,通常为FASTQ格式。`<output_sam_file>` 是比对结果的输出文件,通常输出为SAM格式,但是Bowtie2也能输出BAM格式。 3. 为了优化比对过程,Bowtie2提供许多参数来自定义比对条件,例如,可以选择是否报告多于一个最佳的比对位置、允许的最大gap大小等。 4. 比对完成后,通常需要将SAM格式的文件转换为更为紧凑的BAM格式,并进行排序。这可以通过Samtools来完成: ``` samtools view -Sb <output_sam_file> > <output_bam_file> samtools sort <output_bam_file> -o <sorted_output_bam_file> ``` 以上就是使用Bowtie2进行基因组序列比对的基本步骤。需要注意的是,具体使用时可能需要根据数据和研究目的调整参数,以获得最佳的比对结果。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值