TEsorter 是一个用于分类和可视化转座元件(TEs)的工具,特别是长末端重复转座子(LTR-retrotransposons)在植物基因组中。以下是关于TEsorter的主要功能和特点:
1.分类功能:
TEsorter 能够将TEs分类到超家族级别,并且进一步将LTR-RTs(长末端重复转座子)分类到支系(clade)级别。它使用保守的蛋白域数据库GyDB和REXdb来实现这一分类。TEsorter基于隐藏马尔可夫模型(HMM)配置文件,这些文件是从TE蛋白域数据库中获得的。
##conda 安装
conda install -c bioconda tesorter
$ TEsorter -h
usage: TEsorter [-h] [-v] [-db {gydb,rexdb,rexdb-plant,rexdb-metazoa,rexdb-pnas,rexdb-line,sine}] [--db-hmm DB_HMM]
[-st {nucl,prot}] [-pre PREFIX] [-fw] [-p PROCESSORS] [-tmp TMP_DIR] [-cov MIN_COVERAGE] [-eval MAX_EVALUE]
[-prob MIN_PROBABILITY] [-nocln] [-cite] [-dp2] [-rule PASS2_RULE] [-nolib] [-norc] [-genome]
[-win_size WIN_SIZE] [-win_ovl WIN_OVL]
sequence
lineage-level classification of transposable elements using conserved protein domains.
positional arguments:
sequence input TE/LTR or genome sequences in fasta format [required]
options:
-h, --help show this help message and exit
-v, --version show program's version number and exit
-db {gydb,rexdb,rexdb-plant,rexdb-metazoa,rexdb-pnas,rexdb-line,sine}, --hmm-database {gydb,rexd