MitoZ|Multi-Kmer mode

本文介绍如何在MitoZ的quickmode遇到PCG识别不足时,切换到multi-Kmermode,需准备特定输入文件如基因组序列、PCG编码文件和高通量比对结果。通过示例命令展示了如何运行并获取outprefix.multiKmer_seq_picked.clean.fa输出。
摘要由CSDN通过智能技术生成

一、什么情况下运行Multi-Kmer mode

  当使用MitoZ的quick mode(–run_mode 2),有一些蛋白质编码基因(PCGs)未找到,可以尝试一下multi-Kmer mode(–run_mode 3)。

二、输入文件

  在运行该模式前,需要准备好quick mode生成的几个文件作为输入文件,包括:

  1. work71.hmmout.fa 或 quickMode.fa,提供的fasta文件中要含有您的样品的正确的线粒体基因组序列。
  2. 要手动创建一个.txt文件,里面描述了在某条序列上编码着哪些PCGs,格式:
    seqid1 PCG1 PCG2
    seqid2 PCG3
  3. work71.hmmtblout.besthit.sim.filtered.fa
  4. work71.hmmtblout.besthit.sim.filtered.high_abundance_*X.reformat.sorted

三、示例

$ python3 MitoZ.py all2 --genetic_code 5 --clade Arthropoda --outprefix test \
--thread_number 12 --fastq1 clean.1.fq.gz --fastq2 clean.2.fq.gz \
--fastq_read_length 150 --insert_size 250 \
--run_mode 3 \
--filter_taxa_method 1 \
--requiring_taxa 'Arthropoda' \
--quick_mode_seq_file quickMode.fa \
--quick_mode_fa_genes_file quick_mode_fa_genes.txt  \
--missing_PCGs ND4L ND6 ND2 \
--quick_mode_score_file work71.hmmtblout.besthit.sim.filtered.high_abundance_10.0X.reformat.sorted  \
--quick_mode_prior_seq_file work71.hmmtblout.besthit.sim.filtered.fa

在这里插入图片描述
  输出的结果文件为outprefix.multiKmer_seq_picked.clean.fa,保存在outprefix.assembly2文件夹下。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值