MitoZ|Multi-Kmer mode

最新推荐文章于 2025-04-01 10:38:30 发布

name_qgy

最新推荐文章于 2025-04-01 10:38:30 发布

阅读量1.2k

点赞数

分类专栏：生物信息文章标签：生物信息学

本文链接：https://blog.csdn.net/qq_50637636/article/details/119419546

版权

本文介绍如何在MitoZ的quickmode遇到PCG识别不足时，切换到multi-Kmermode，需准备特定输入文件如基因组序列、PCG编码文件和高通量比对结果。通过示例命令展示了如何运行并获取outprefix.multiKmer_seq_picked.clean.fa输出。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、什么情况下运行Multi-Kmer mode

当使用MitoZ的quick mode（–run_mode 2），有一些蛋白质编码基因（PCGs）未找到，可以尝试一下multi-Kmer mode(–run_mode 3)。

二、输入文件

在运行该模式前，需要准备好quick mode生成的几个文件作为输入文件，包括：

work71.hmmout.fa 或 quickMode.fa，提供的fasta文件中要含有您的样品的正确的线粒体基因组序列。
要手动创建一个.txt文件，里面描述了在某条序列上编码着哪些PCGs，格式：
seqid1 PCG1 PCG2
seqid2 PCG3
work71.hmmtblout.besthit.sim.filtered.fa
work71.hmmtblout.besthit.sim.filtered.high_abundance_*X.reformat.sorted

三、示例

$ python3 MitoZ.py all2 --genetic_code 5 --clade Arthropoda --outprefix test \
--thread_number 12 --fastq1 clean.1.fq.gz --fastq2 clean.2.fq.gz \
--fastq_read_length 150 --insert_size 250 \
--run_mode 3 \
--filter_taxa_method 1 \
--requiring_taxa 'Arthropoda' \
--quick_mode_seq_file quickMode.fa \
--quick_mode_f

最低0.47元/天解锁文章