基于RNAfold预测RNA的二级结构(命令行版)

RNAfold子程序实质上是封装在ViennaRNA软件包中。
  1. https://www.tbi.univie.ac.at/RNA/#download网站下载ViennaRNA(version1.8.5)源码包,编译安装。安装过程不再细讲。不会的可参照我之前的博客。
    在这里插入图片描述
  2. 运行以下命令批量预测和绘制RNA二级结构图
/usr/local/bin/RNAfold -p < test.fa > test.res
# /usr/local/bin/RNAplot -t 1 -o svg --pre aaa < test.res # 基于1的结果绘图
/biodata/02.software/ViennaRNA-1.8.5/Utils/relplot.pl test_sequenc_ss.ps test_sequenc_dp.ps > 5S_rss.ps # 可靠性信息以颜色注释的形式呈现给RNA二级结构图(beauty)
gv 5S_rss.ps # 查看二级结构
# 将postscript文件转成pdf图(另还可用ghostscript转化)
magick convert -density 300 5S_rss.ps 5S_rss.pdf # 生成二级结构pdf图
magick convert -density 300 5S_rss.pdf 5S_rss.png

说明:RNAfold会生成两个文件。一个为postscript文件,这种文件可以转换为PDF格式。
在这里插入图片描述
生成的二级结构图如下:
生成的二级结构图如下

另产生的str文件内容如下:在这里插入图片描述
该结果采用dot-bracket表示法标记二级结构,上述用法只给出了最佳的二级结构预测结果和对应的自由能。
关于dot-bracket表示法解释:
该表示方法就称之为dot-bracket notation, 其核心思想是利用配对的括号来表示碱基的互补配对,用连续的点号来表示茎环结构,对于下图所示的二级结构

RNA二级结构表示法Dot-Bracket notation如何理解:

对应的表达式如下

(((..((((...)))).)))

从第一个黑色圆点对应的碱基开始,一开始是3个配对碱基,所以先用3个(表示,接下来是茎环结构中未配对的两个碱基,用2个.表示,然后是4个配对碱基,再然后是未配对的3个碱基,再往后的配对碱基与前面左括号(表示的碱基相配对,所以用右括号)表示。

这种表示方式只采用了两种符号,而且都是计算机可以识别的符号,所以软件也可以识别,在很多软件和数据库中,给出的二级结构都会用这种方式来表示。

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值