如何注释基因组中的tRNA + 安装tRNAscan-SE

简介

  • tRNA:tRNA是mRNA翻译到蛋白的步骤中根据密码子搬运氨基酸的RNA。这个结构的最核心部位就是与密码子配对的三位碱基。tRNA长得像一个三叶草,大概76-90 bp,所以除了三位碱基,识别其二维结构,是为了知道如何折叠成三叶草。
  • tRNAscan-SE用 Perl 整合了tRNAscan、EufindRNA 和Cove3个tRNA检测软件。首先调用 tRNAscan和EufindRNA鉴定基因组序列中 tRNA区域,然后调用Cove进行验证。
  • 目前2.0版本正在beta阶段,最新的下载稳定版本为1.3.1
  • 网页版是2.0版,会根据数据库找最相似的tRNA。
  • 如只需安装看步骤即可,说明中总结我遇到的问题。


本地化安装步骤

  1. 进入 Linux
  2. 下载 tRNAScan-SE 1.3.1.tar.gz
  3. 解压缩
  4. 进入 tRNAScan-SE 1.3.1 目录
  5. 修改 Makefile 中的相关路径,能sudo安装到opt里就不用这步。
  6. make 编译
  7. 安装
  8. 运行 testrun 检验是否运行成功
  9. 删除 make 的文件


命令

wget http://lowelab.ucsc.edu/software/tRNAscan-SE.tar.gz
tar zxf tRNAscan-SE.tar.gz
cd tRNAscan-SE-1.3.1
sudo make && make install
make testrun
make clean


安装过程说明

  1. 从服务器下载 tRNAScan-SE 1.3.1.tar.qz(2017-07-26最新),在其web server 页面没有找到关于本地版的说明。
  2. 如果你有root权限,又和我一样还不太懂$PASH怎么改,就不要自己修改安装路径了。默认安装在根目录opt文件夹里的biosoft文件夹中。
  3. 安装过程中有一些提示信息,不懂可以不管。也是关于改路径的。

Makefile 里面的安装路径是:
BINDIR = /opt/biosoft/tRNAscan-SE-1.3.1/bin
LIBDIR = /opt/biosoft/tRNAscan-SE-1.3.1/lib/tRNAscan-SE
MANDIR = /opt/biosoft/tRNAscan-SE-1.3.1/man


使用说明

网页版运行后给出的运行的命令行:
tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -s# (fasta file)

  • 其中.conf文件是一个设置文件,可以点开看。
  • 输出的结果里面有两个score,
    • cove score,最后的一个分值,最低20,是每一个isotype的分值
    • 还有一个infernal score,是用来过滤,提高计算速度的
  • 帮助文件运行 tRNAsecn-SE -h,参考3的说明挺详细。
  • 运行的主要参数包括
    • 选择tRNA类型(默认细菌)-B
    • 不检测是不是假基因 -D
    • 输出文件的类型:
      • -o <file> 总结果
      • -f <file> 二级结构结果
      • # 如果把 # 放在<file>处,没有空格隔开表示使用默认名字
  • 文档中提供了一个postscript的帮助,Mannual.ps,我用的远程登录ssh,也不知道怎么打开图形界面,所以下到本地又下了GView 和 Ghostscript打开的。30多页,可是也没有觉得有什么特别有用的。写着有个html版本的,可是现在也打不开了。


结果确认

  • 网页目前使用的是2.0版本
  • 使用的序列是NCBI上面下载的细菌基因组,其注释信息显示有39个tRNA,4.62MB。
  • 测试
    • 设置1: default:返回41个结果,速度最快,大约10s。
      tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -B -s# (fasta file)
    • 设置2:Legacy(tRNAscan+Eufindtran -> cove) -:返回39个结果
      tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -L -B -s# (fasta file)
    • 设置3:不适用过滤算法,等了30min还在计算,果然很慢,放弃。
  • 区别: -L参数默认值为116bp,大于这个数值的tRNA被删除,删除的这两个的确没有对应到NCBI里面的结果。
    两个.conf本身没有区别。
    观察了下,被滤掉的2条大于116bp的序列cove score在30以下,且二维结构里面看出来成环的区域很长,就是下面的...很长,箭头和箭头连起来后会很不稳定的样子。
Seq: TGTAGGATGTTGAAATTGGCaGACAAGCCCTCCTGTCTCGGGGGTGGGGAAcccagcataaagcgtaattcaaaccggactattgccTAACgACCCCGTGGAGGTTCGAATCCTTCTCCTACAG
Str: >>>>>>>..>>>...........<<<.>>>>>.......<<<<<.>>>>............................................<<<<..>>>>>.......<<<<<<<<<<<<. 
  • 如果选的是真核模式,预测出来的是38条,所以模式还是很重要。


参考

[1] 说明了安装过程的提示信息是用于修改c shell的
[2] 关于postscript的说明和如何看结果
[3] 详细的网页版输出结果说明
[4] 关于2.0的2016年的论文

转载于:https://www.cnblogs.com/Xeonilian/p/trnascan-se-install.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值