开放阅读框(Open Reading Frame, ORF)是由起始密码子开始,直到终止密码子结束,中间不含有其他终止密码子的核酸序列。由于 DNA 是双链结构,任何一条链都可以作为模板合成 RNA;并且又因为遗传密码是三联体,由三个核苷酸决定一个氨基酸,因此对于一段 DNA 序列,有六种可能的阅读框(正向三个,反向三个)。通常情况下,六种阅读框只有一种是正确的:一般是翻译得到最长氨基酸序列的阅读框。

给定: Fasta 文件中一条长度不超过 1kb 的 DNA 序列。
需得: 不同的由 ORF 翻译而来的蛋白序列。返回翻译的蛋白序列时可以是任意顺序。
示例数据
>Rosalind_99
AGCCATGTAGCTAACTCAGGTTACATGGGGATGACCCCGCGACTTGGATTAGAGTCTCTTTTGGAATAAGCCTGAATGATCCGAGTAGCATCTCAG
示例结果
MLLGSFRLIPKETLIQVAGSSPCNLS
M
MGMTPRLGLESLLE
MTPRLGLESLLE
Python 实现
Open_Reading_Frames.py