RNAfold子程序实质上是封装在ViennaRNA软件包中。
- 从https://www.tbi.univie.ac.at/RNA/#download网站下载ViennaRNA(version1.8.5)源码包,编译安装。安装过程不再细讲。不会的可参照我之前的博客。
- 运行以下命令批量预测和绘制RNA二级结构图
/usr/local/bin/RNAfold -p < test.fa > test.res
# /usr/local/bin/RNAplot -t 1 -o svg --pre aaa < test.res # 基于1的结果绘图
/biodata/02.software/ViennaRNA-1.8.5/Utils/relplot.pl test_sequenc_ss.ps test_sequenc_dp.ps > 5S_rss.ps # 可靠性信息以颜色注释的形式呈现给RNA二级结构图(beauty)
gv 5S_rss.ps # 查看二级结构
# 将postscript文件转成pdf图(另还可用ghostscript转化)
magick convert -density 300 5S_rss.ps 5S_rss.pdf # 生成二级结构pdf图
magick convert -density 300 5S_rss.pdf 5S_rss.png
说明:RNAfold会生成两个文件。一个为postscript文件,这种文件可以转换为PDF格式。
生成的二级结构图如下:
另产生的str文件内容如下:
该结果采用dot-bracket表示法标记二级结构,上述用法只给出了最佳的二级结构预测结果和对应的自由能。
关于dot-bracket表示法解释:
该表示方法就称之为dot-bracket notation, 其核心思想是利用配对的括号来表示碱基的互补配对,用连续的点号来表示茎环结构,对于下图所示的二级结构
RNA二级结构表示法Dot-Bracket notation如何理解:
对应的表达式如下
(((..((((...)))).)))
从第一个黑色圆点对应的碱基开始,一开始是3个配对碱基,所以先用3个(表示,接下来是茎环结构中未配对的两个碱基,用2个.表示,然后是4个配对碱基,再然后是未配对的3个碱基,再往后的配对碱基与前面左括号(表示的碱基相配对,所以用右括号)表示。
这种表示方式只采用了两种符号,而且都是计算机可以识别的符号,所以软件也可以识别,在很多软件和数据库中,给出的二级结构都会用这种方式来表示。