本文为Mothur使用者提供了基础命令解读中文注释版,结合Mothur进阶系列教程。其中,命令解读顺序依其在本教程第一次出现的位置排序。
Mothur官网为使用者提供了命令解读英文版(https://mothur.org/wiki/tags/#commands)。我们的注释版将提供了与本教程相关且常用的命令解读中文版(命令解读顺序依其在本教程第一次出现的位置排序)。
make.file:该命令为序列的拼接 (make.contigs)、创建输入文件。这个命令将多个文件连接起来并把结果输出到一个清单文件(stability.file)中。
make.contigs:该命令用于读取一个正向fastq文件和一个反向fastq文件并输出一个新的fasta文件和report文件。
summary.seqs: 该命令用于总结(概述)一个未排序或已排序的fasta格式文件的序列质量。
screen.seqs: 该命令用于保留符合用户自定义标准的序列,也可用于从names、group、contigsreport、alignreport、summary文件中挑选出不符合用户自定义标准的序列。
get.current:该命令用于显示数据处理过程中目前不同类型的最新版文件。
unique.seqs: 该命令只会输出fasta格式测序文件中的唯一化序列和一个表征它们与参考序列一致的文件。
count.seqs: 又作make.table,该命令用于计算name文件中代表性序列的数量。如果提供了group文件,也可用于提供group中的组别数量。
pcr.seqs:该命令将按照用户自定义的选项修剪已输入序列。
rename.file: 该命令用于使用mothur修改对文件重命名,当文件名太长不便使用时使用。
align.seqs: 该命令用于把用户提供的fasta格式的候选序列文件对齐到用户提供的同样格式的模板序列。
filter.seqs: 该命令用于根据用户自定义标准从对齐文件中移除列。
pre.cluster:该命令用于实现伪单链接算法(pseudo-singe linkage algorithm),这个算法的主要目的是为了去除那些可能由于焦磷酸测序错误产生的序列。
chimera.vsearch: 该命令用于读取fasta文件和参考文件/fasta格式文件和name/count格式文件,并输出所有潜在的嵌合序列。
remove.seqs: 该命令利用序列名称和fastq、fasta、name、group、list、count或者是align.report格式的任何一个文件来生成一个不包括列表中某些特定序列的新文件。
classify.seqs: 该命令可使用户使用不同的方法将其筛选出来的序列分配到不同的分类提纲中。
remove.lineage:该命令用于读取taxonomy文件和taxon文件,并生成一个只包含不在taxon中序列的文件。
summary.tax: 该命令用于读取taxonomy文件和选择性的name或group文件,并总结taxonomy信息。
get.group:该命令提供用于当前存储的多样本otu数据的分组列表。
seq.error: 该命令用于读取fasta文件并基于参考文件寻找其中序列中的错误。
dist.seqs:该命令用于计算已对齐的dna序列未校正的成对距离(双尾距离,pairwise distanc)。
cluster:该命令用于将已对齐的序列聚类为otus,前提是在mothur中输入距离矩阵。
make.shared: 该命令用于读取list和group、biom文件并为每个组创建.shared和rebund文件。
rarefaction.single: 该命令通过无替代的二次抽样方法生成每个样本的稀释曲线。
remove.groups: 该命令用于从fasta、name、group、list、taxonomy和shared格式文件中的某个组或组群中移除序列。
cluster.split: 该命令用于将序列对齐至otus并输出.list文件。
classify.otu:该命令用于otu的物种注释。
Phylotype:该命令用于将基于物种分类将序列对齐至otus并输出.list、.rabund、.sabund文件。
clearcut:该命令可使用户在mothur内部运行clearcut程序。
count.groups: 该命令用于计算group、count或shared文件的某个组或组群中的序列数量。
sub.sample: 该命令用于标准化数据或者从原始分组中创建更小的分组。
summary.single:该命令用于生成一个综合文件,文件中包含着每行otu数据的计算值和group文件中不同组之间所有可能的比较。
dist.shared: 该命令用于生成phylip格式且描述多组之间差异度的距离矩阵。
pcoa:该命令用于pcoa参数的相关计算。
nmds: 该命令用于nmds参数的相关计算。
amova:该命令用于进行分析方差分析(一种传统的非参数方差分析)。
homova:该命令用于分子方差同质性分析。其中,种群遗传学中用于检验两个或多个种群内的遗传多样性是同质的假设;方差同质性的非参数类比。
corr.axes: 该命令用于计shared/rebund文件中每一列的相关系数,该系数即为pcoa每一轴的参数。
metastats:该命令用于分析在不同group中丰度差异显著的菌群。
get.communitytype:该命令利用概率建模将微生物群落聚类为元群落或肠型。
lefse:该命令用于显示组间差异物种,并生成lda文件。
phylo.diversity:该命令用于计算系统发育多样性。
unifrac.unweighted:该命令用于执行unweighted.unifrac算法。
unifrac.weighted:该命令用于执行unweighted.unifrac算法的weighted版本。
这篇推文对你有帮助吗?喜欢这篇文章吗?喜欢就不要错过呀,关注本知乎号查看更多的环境微生物生信分析相关文章。亦可以用微信扫描下方二维码关注“环微分析”微信公众号,小编在里面载入了更加完善的学习资料供广大生信分析研究者爱好者参考学习,也希望读者们发现错误后予以指出,小编愿与诸君共同进步!!!
学习环境微生物分析,关注“环微分析”公众号,持续更新,开源免费,敬请关注!
转载自原创文章:
Mothur7进阶_Mothur实战基础命令大全_Mothur基础指令及其含义
最后,再次感谢你阅读本篇文章,真心希望对你有所帮助。感谢!