#创建conda环境
conda create -n REPEAT RepeatMaskerr Repeatmodeler
conda activate REPEAT
#使用RepeatMasker进行重复序列比对
#使用RepeatMasker自有数据库预测重复
RepeatMasker -e ncbi -specoes Ciona intestinalis -gff -html -dir repeat Halful.fa
#自建数据库进行重复预测
BuildDatabase -name halfulmodeler Halful.fa
RepeatModeler -database halfulmodeler -pa 10 -LTRStruct
nohup RepeatModler -database halfulmodeler -pa 10 -LTRStruct &
#RepeatModeler生成halfulmodeler-families.fa halfulmodeler-families.stk
RepeatMasker -e ncbi -lib halfulmodeler-families.fa -pa 10 Halful.fa
#生成.fasta.out 记录基因组重复的位置信息类型
.fasta.tbl 对各重复归类汇总
.fasta.masked重复序列替换为N,用于后续注释
参考