如何注释基因组中的tRNA + 安装tRNAscan-SE

最新推荐文章于 2024-06-18 11:02:45 发布

dej0257

最新推荐文章于 2024-06-18 11:02:45 发布

阅读量942

点赞数

文章标签：运维 shell 操作系统

原文链接：http://www.cnblogs.com/Xeonilian/p/trnascan-se-install.html

版权

简介

tRNA：tRNA是mRNA翻译到蛋白的步骤中根据密码子搬运氨基酸的RNA。这个结构的最核心部位就是与密码子配对的三位碱基。tRNA长得像一个三叶草，大概76-90 bp，所以除了三位碱基，识别其二维结构，是为了知道如何折叠成三叶草。
tRNAscan-SE用 Perl 整合了tRNAscan、EufindRNA 和Cove3个tRNA检测软件。首先调用 tRNAscan和EufindRNA鉴定基因组序列中 tRNA区域，然后调用Cove进行验证。
目前2.0版本正在beta阶段，最新的下载稳定版本为1.3.1
网页版是2.0版，会根据数据库找最相似的tRNA。
如只需安装看步骤即可，说明中总结我遇到的问题。

本地化安装步骤

进入 Linux。
下载 tRNAScan-SE 1.3.1.tar.gz
解压缩
进入 tRNAScan-SE 1.3.1 目录
修改 Makefile 中的相关路径，能sudo安装到opt里就不用这步。
make 编译
安装
运行 testrun 检验是否运行成功
删除 make 的文件

命令

wget http://lowelab.ucsc.edu/software/tRNAscan-SE.tar.gz
tar zxf tRNAscan-SE.tar.gz
cd tRNAscan-SE-1.3.1
sudo make && make install
make testrun
make clean

安装过程说明

从服务器下载 tRNAScan-SE 1.3.1.tar.qz（2017-07-26最新），在其web server 页面没有找到关于本地版的说明。
如果你有root权限，又和我一样还不太懂$PASH怎么改，就不要自己修改安装路径了。默认安装在根目录opt文件夹里的biosoft文件夹中。
安装过程中有一些提示信息，不懂可以不管。也是关于改路径的。

Makefile 里面的安装路径是：
BINDIR = /opt/biosoft/tRNAscan-SE-1.3.1/bin
LIBDIR = /opt/biosoft/tRNAscan-SE-1.3.1/lib/tRNAscan-SE
MANDIR = /opt/biosoft/tRNAscan-SE-1.3.1/man

使用说明

建议去网页版 Web Server提交示例。然后看一下返回的结果，和实际运行的代码。

网页版运行后给出的运行的命令行：
tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -s# (fasta file)

其中.conf文件是一个设置文件，可以点开看。
输出的结果里面有两个score，
- cove score，最后的一个分值，最低20，是每一个isotype的分值
- 还有一个infernal score，是用来过滤，提高计算速度的
帮助文件运行 tRNAsecn-SE -h，参考3的说明挺详细。
运行的主要参数包括
- 选择tRNA类型（默认细菌）-B
- 不检测是不是假基因 -D
- 输出文件的类型：
  - -o <file> 总结果
  - -f <file> 二级结构结果
  - # 如果把 # 放在<file>处，没有空格隔开表示使用默认名字
文档中提供了一个postscript的帮助，Mannual.ps，我用的远程登录ssh，也不知道怎么打开图形界面，所以下到本地又下了GView 和 Ghostscript打开的。30多页，可是也没有觉得有什么特别有用的。写着有个html版本的，可是现在也打不开了。

结果确认

网页目前使用的是2.0版本
使用的序列是NCBI上面下载的细菌基因组，其注释信息显示有39个tRNA，4.62MB。
测试
- 设置1： default:返回41个结果，速度最快，大约10s。
  tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -B -s# (fasta file)
- 设置2：Legacy(tRNAscan+Eufindtran -> cove) -：返回39个结果
  tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -L -B -s# (fasta file)
- 设置3：不适用过滤算法，等了30min还在计算，果然很慢，放弃。
区别： -L参数默认值为116bp，大于这个数值的tRNA被删除，删除的这两个的确没有对应到NCBI里面的结果。
两个.conf本身没有区别。
观察了下，被滤掉的2条大于116bp的序列cove score在30以下，且二维结构里面看出来成环的区域很长，就是下面的...很长，箭头和箭头连起来后会很不稳定的样子。

Seq: TGTAGGATGTTGAAATTGGCaGACAAGCCCTCCTGTCTCGGGGGTGGGGAAcccagcataaagcgtaattcaaaccggactattgccTAACgACCCCGTGGAGGTTCGAATCCTTCTCCTACAG
Str: >>>>>>>..>>>...........<<<.>>>>>.......<<<<<.>>>>............................................<<<<..>>>>>.......<<<<<<<<<<<<.

如果选的是真核模式，预测出来的是38条，所以模式还是很重要。

参考

[1] 说明了安装过程的提示信息是用于修改c shell的
[2] 关于postscript的说明和如何看结果
[3] 详细的网页版输出结果说明
[4] 关于2.0的2016年的论文

转载于:https://www.cnblogs.com/Xeonilian/p/trnascan-se-install.html

dej0257

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
如何注释基因组中的tRNA + 安装tRNAscan-SE

简介tRNA：tRNA是mRNA翻译到蛋白的步骤中根据密码子搬运氨基酸的RNA。这个结构的最核心部位就是与密码子配对的三位碱基。tRNA长得像一个三叶草，大概76-90 bp，所以除了三位碱基，识别其二维结构，是为了知道如何折叠成三叶草。tRNAscan-SE用 Perl 整合了tRNAscan、EufindRNA 和Cove3个tRNA检测软件。首先调用 tRNAscan和Euf...
复制链接

扫一扫