1,ORF简介
开放阅读框(Open Reading Frame,ORF)从起始密码子开始,到终止密码子结束的连续碱基序列,具有蛋白质编码潜能。由于密码子(codon)读写起始位点的不同,mRNA序列可能按照6种ORF阅读和翻译。如图1所示,对于序列1,可以从A开始读,也可以从T开始读,也可以从G开始读,因此一条序列上就有3种读码方式。同样的,互补链上也有3种,共6种ORF阅读方式。理论上,6种读码框都有“开放”的可能,但是现实世界中,生物体一般会使用不多于2个“开放读码框”。
图1. 6种读码框示意图
2,NCBI ORFfinder
ORF识别是确定哪种开放阅读框对应真正的多肽编码序列的过程。NCBI ORFfinder为最常用的ORF预测在线工具,使用也非常简单。
2.1,打开NCBI ORFfinder网站
在浏览器中输入网站:https://www.ncbi.nlm.nih.gov/orffinder/