1、下载人类基因组序列,注意要是基因组数据,由于整体过大,这里下载了染色体16的数据
从ensembl上下载
Index of /pub/release-107/fasta/homo_sapiens/dna
选择了Homo_sapiens.GRCh38.dna.chromosome.16.fa.gz
文件大小大概在23M
2、在linux上安装RepeatMasker
参考
RepeatMasker(一)——安装及使用_柚子味的羊的博客-CSDN博客_repeatmasker安装
RepeatModeler的安装(包含RepeatMasker安装)_nnnnnnny-的博客-CSDN博客_repeatmodeler安装
3、输入参数
RepeatMasker -pa 6 -nolow -species human -poly -html -gff -a -dir repeat_result_human Homo_sapiens.GRCh38.dna.chromosome.16.fa
一共运行了大概2h才得到结果
4、得到结果
可以看一下统计结果