拿到fastq文件后,要进行比对和排序
第一步是对reference建立索引
bwa index -a bwtsw $reference #对于大基因组建立FM-Index
#bwa index -a is ref.fasta #对小基因组建立index,速度快,内存消耗大
第二步,批量比对和排序
# 2.使用bwa men 比对
mkdir -p ../fina1_bam
cat SRR_Acc_List.txt|while read line
do
$bwa mem -t 16 -M -Y -R "@RG\tID:$line\tPL:ILLUMINA\tLB:$line\tSM:$line" $reference ../bam/${line}.fastq.gz | $samtools view -Sb -t 16 -f bam > ../fina1_bam/${line}.bam &&
echo "** ${line} BWA MEM done **"
# 3.排序
$samtools sort -@ 16 -m 4G -O bam ../fina1_bam/${line}.bam -o ../fina1_bam/${line}.sorted.bam && \
$samtools index ../fina1_bam/${line}.sorted.bam
echo "** ${line} sorted raw bam file done **"
done