给参考基因组建立index

faidx index

samtools faidx *.fa

Usage: samtools faidx <file.fa|file.fa.gz> [<reg> [...]]
Option: 
 -o, --output FILE        Write FASTA to file.
 -n, --length INT         Length of FASTA sequence line. [60]
 -c, --continue           Continue after trying to retrieve missing region.
 -r, --region-file FILE   File of regions.  Format is chr:from-to. One per line.
 -i, --reverse-complement Reverse complement sequences.
     --mark-strand TYPE   Add strand indicator to sequence name
                          TYPE = rc   for /rc on negative strand (default)
                                 no   for no strand indicator
                                 sign for (+) / (-)
                                 custom,<pos>,<neg> for custom indicator
     --fai-idx      FILE  name of the index file (default file.fa.fai).
     --gzi-idx      FILE  name of compressed file index (default file.fa.gz.gzi).
 -f, --fastq              File and index in FASTQ format.
 -h, --help               This message.

bwa index

bwa index -a bwtsw *.fa -p *.fa

Usage:   bwa index [options] <in.fasta>

Options: -a STR    BWT construction algorithm: bwtsw, is or rb2 [auto]
         -p STR    prefix of the index [same as fasta name]
         -b INT    block size for the bwtsw algorithm (effective with -a bwtsw) [10000000]
         -6        index files named as <in.fasta>.64.* instead of <in.fasta>.* 

Warning: `-a bwtsw' does not work for short genomes, while `-a is' and
         `-a div' do not work not for long genomes.

picard index

java -jar picard.jar CreateSequenceDictionary \
R = *.fa \
O = *.dict

picard index 参数较多,暂不列出

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
参考基因组index是一个用于加速基因组比对和寻找特定区域的工具。以下是一些步骤,可以用于给参考基因组建立index: 1. 准备参考基因组文件:参考基因组文件应该是一个FASTA格式的文件,其中包含所有染色体/基因组的序列。确保该文件已正确格式化。 2. 安装比对软件:需要安装一个支持参考基因组index建立的比对软件。常见的软件包括Bowtie、BWA和STAR等。不同的软件可能有不同的命令和参数。 3. 建立索引:根据所使用的比对软件的不同,建立索引的命令也不同。例如,使用Bowtie2建立索引的命令如下所示: `bowtie2-build reference_genome.fa reference_genome` 其中,第一个参数是参考基因组文件的名称,第二个参数是要生成的索引文件的前缀。在这个例子中,生成的索引文件将被命名为reference_genome。 4. 检查索引:确保索引已正确生成。可以使用该软件的“index check”命令进行检查。例如,使用Bowtie2检查索引的命令如下所示: `bowtie2-inspect -n reference_genome` 其中,-n选项用于指定输出文件的格式。在这个例子中,输出将是一个名为reference_genome.1.bt2的文件。 5. 使用索引:一旦索引已经建立,我们就可以开始使用它进行基因组比对和寻找特定区域。根据比对软件的不同,可能需要使用不同的命令和参数来指定索引文件。例如,使用Bowtie2进行比对的命令如下所示: `bowtie2 -x reference_genome -1 read1.fastq -2 read2.fastq -S output.sam` 其中,-x选项用于指定索引文件的名称,-1和-2选项用于指定待比对的read文件,-S选项用于指定输出文件的名称。在这个例子中,输出将是一个名为output.sam的SAM格式文件。 以上就是建立参考基因组index的基本步骤。根据不同的软件和数据,可能需要使用不同的参数和工具来进行基因组比对和数据分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值