从NCBI下载牛基因组,下载后gunzip解压
wget ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/002/263/795/GCF_002263795.1_ARS-UCD1.2/GCF_002263795.1_ARS-UCD1.2_genomic.fna.gz
安装bowtie2
sudo apt-get install bowtie2
构建索引数据库
bowtie2-build GCF_002263795.1_ARS-UCD1.2_genomic.fna cattlegenome #cattlegenome是输出,fna文件是fa格式的输入
比对。-p线程数,-x参考基因组的基本名(除了后缀名),-1和-2配对双端序列,-S输出sam文件,--un-conc 输出未注释成功的结果,双端结果会以.1和.2区分。--un-conc-gz输出gz压缩序列
bowtie2 -p 15 -x /mnt/10t/database/cattle/cattlegenome -1 1.clip.1.fq.gz -2 1.clip.2.fq.gz -S sample.sam --un-conc 1.fq
新建sh文件夹和dehost文件夹(略)
生成所有需要的文件
for i in 123 98 126 4 128 32 134 8 130 29 131 42 119 19 139 24 125 37 144 14 117 5 142 13 127 22 129 48 138 47 140 20 132 18 149 73 120 105 148 44 122 30 124 26 143 34 133 12 145 21 152 10 118 102 147 80 121 1 151 35 135 38 136 2 150 17 146 55 141 11 137 97; do echo "bowtie2 -p 15 -x /mnt/10t/database/cattle/cattlegenome -1 /mnt/10t/mzy/rawdata/mazhiyuan/$i.clip.1.fq.gz -2 /mnt/10t/mzy/rawdata/mazhiyuan/$i.clip.2.fq.gz --un-conc-gz /mnt/10t/mzy/rawdata/mazhiyuan/dehost/$i.fq.gz" >/mnt/10t/mzy/rawdata/mazhiyuan/sh/$i.bowtie.sh; done
所有命令一起运行
for i in *.sh; do nohup bash $i & done