TransDecoder:转录本基因预测(真菌)

安装 

Home · TransDecoder/TransDecoder Wiki · GitHub

wget -c https://data.broadinstitute.org/Trinity/CTAT_SINGULARITY/MISC/TransDecoder/transdecoder.v5.7.1.simg
mamba create -n TransDecoder
mamba activate TransDecoder
mamba install -c conda-forge singularity=3.8
singularity exec -e transdecoder.v5.7.1.simg  TransDecoder.LongOrfs -h

使用

pfam-A数据库下载可见PULpy安装与使用_plup安装-CSDN博客

 Swissprot数据库下载可见 Index of /pub/databases/uniprot/knowledgebase/complete

#从头合成的转录本fasta作为输入,比如Trinity的输出文件
singularity exec -e transdecoder.v5.7.1.simg  TransDecoder.LongOrfs -t transcripts.fasta
#搜索上一步候选肽的同源性(更精准),上一步结果在transcripts.fasta.transdecoder_dir/文件夹中
#需要有pfam-A数据库(我已经有)或者Swissprot、Uniref90数据库(以Swissprot为例,快)
#需要有diamond或hmmsearch
mamba install -c bioconda diamond hmmer
wget -c https://ftp.uniprot.org/pub/databases/uniprot/knowledgebase/complete/uniprot_sprot.fasta.gz
gunzip uniprot_sprot.fasta.gz
diamond makedb --in uniprot_sprot.fasta --db uniprot_sprot.fasta
#diamond把假定的肽比对到Swissprot
diamond blastp -d uniprot_sprot.fasta -q transcripts.fasta.transdecoder_dir/longest_orfs.pep --evalue 1e-10 --max-target-seqs 1 --threads 90 > blastp.outfmt6
#hmmsearch把假定的肽比对到pfam
hmmsearch --cpu 90 -E 1e-10 --domtblout pfam.domtblout /path/to/Pfam-A.hmm transdecoder_dir/longest_orfs.pep
#将 Blast 和 Pfam 搜索结果整合到编码区域选择中
singularity exec -e transdecoder.v5.7.1.simg TransDecoder.Predict -t target_transcripts.fasta --retain_pfam_hits pfam.domtblout --retain_blastp_hits blastp.outfmt6
#最终候选编码区域集可以在文件“ .transdecoder ”中找到,其扩展名包括 .pep、.cds、.gff3 和 .bed

  • 8
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值