基因组重复注释

#创建conda环境

conda create -n REPEAT RepeatMaskerr Repeatmodeler
conda activate REPEAT

#使用RepeatMasker进行重复序列比对

#使用RepeatMasker自有数据库预测重复
RepeatMasker -e ncbi -specoes Ciona intestinalis -gff -html -dir repeat Halful.fa

#自建数据库进行重复预测
BuildDatabase -name halfulmodeler Halful.fa

RepeatModeler -database halfulmodeler -pa 10 -LTRStruct

nohup RepeatModler -database halfulmodeler -pa 10 -LTRStruct &

#RepeatModeler生成halfulmodeler-families.fa halfulmodeler-families.stk

RepeatMasker -e ncbi -lib halfulmodeler-families.fa -pa 10 Halful.fa
#生成.fasta.out 记录基因组重复的位置信息类型
.fasta.tbl 对各重复归类汇总
.fasta.masked重复序列替换为N,用于后续注释

参考

基因组重复序列检测:RepeatMasker的安装及使用 - 简书

基因组结构注释 - 简书

如何进行基因组注释_生信技术的博客-CSDN博客_基因组注释信息

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值