python练习题4 将mRNA翻译成蛋白质

最新推荐文章于 2023-02-09 09:38:28 发布

shenny!

最新推荐文章于 2023-02-09 09:38:28 发布

阅读量7.9k

点赞数 4

文章标签： python 生物信息 DNA 序列

本文链接：https://blog.csdn.net/qq_25055921/article/details/78570407

版权

题目地址：http://rosalind.info/problems/prot/

首先，需要先识别mRNA中的翻译起始位点，即AUG,然后从该位置，根据标准遗传密码表，将整个mRNA序列翻译成蛋白质，如果中途遇到终止密码子，则显示Stop.

当然，biopython也提供了翻译蛋白质的模块，可以很方便的将mRNA或者DNA翻译成蛋白质。

这是不用biopython的代码：

#*_coding: utf-8_*
import re
def mRNA_protein(RNA_string):
    '''将mRNA翻译成蛋白质'''
    start_code = 'AUG'
    end_code = ['UAA', 'UAG', 'UGA']
    protein_table = {'UUU': 'F', 'CUU': 'L', 'AUU': 'I', 'GUU': 'V', \
                     'UUC': 'F', 'CUC': 'L', 'AUC': 'I', 'GUC': 'V', \
                     'UUA': 'L', 'CUA': 'L', 'AUA': 'I', 'GUA': 'V', \
                     'UUG': 'L', 'CUG': 'L', 'AUG': 'M', 'GUG': 'V', \
                     'UCU': 'S', 'CCU': 'P', 'ACU': 'T', 'GCU': 'A', \
                     'UCC': 'S', 'CCC': 'P', 'ACC': 'T', 'GCC': 'A', \
                     'UCA': 'S', 'CCA': 'P', 'ACA': 'T', 'GCA': 'A', \
                     'UCG': 'S', 'CCG': 'P', 'ACG': 'T', 'GCG': 'A', \
                     'UAU': 'Y', 'CAU': 'H', 'AAU': 'N', 'GAU': 'D', \
                     'UAC': 'Y', 'CAC': 'H', 'AAC': 'N', 'GAC': 'D', \
                     'UAA': 'Stop', 'CAA': 'Q', 'AAA': 'K', 'GAA': 'E', \
                     'UAG': 'Stop', 'CAG': 'Q', 'AAG': 'K', 'GAG': 'E', \
                     'UGU': 'C', 'CGU': 'R', 'AGU': 'S', 'GGU': 'G', \
                     'UGC': 'C', 'CGC': 'R', 'AGC': 'S', 'GGC': 'G', \
                     'UGA': 'Stop', 'CGA': 'R', 'AGA': 'R', 'GGA': 'G', \
                     'UGG': 'W', 'CGG': 'R', 'AGG': 'R', 'GGG': 'G'
                     }
    #找到起始密码子的位置
    start_sit = re.search(start_code, RNA_string)
    protein = ''
    #按阅读框匹配蛋白质
    for sit in range(start_sit.end(), len(RNA_string), 3):
        protein = protein + protein_table[RNA_string[sit:sit+3]]
    print protein

if __name__ == '__main__':
    RNA_string = open('E:\\bioinfo\data\\rosalind_prot\\rosalind_prot.txt', 'r').read().strip()
    mRNA_protein(RNA_string)

下面是使用biopython的代码：

#_*_ coding: utf-8 _*
from Bio import Seq
from Bio.Alphabet import generic_dna, generic_rna
from Bio import SeqIO
from Bio.Data import CodonTable
#载入mRNA序列
RNA_string = open('E:\\bioinfo\data\\rosalind_prot\\rosalind_prot.txt', 'r').read().strip()
my_seq = Seq.Seq(RNA_string, generic_rna)
#载入标准遗传密码表
standard_table = CodonTable.unambiguous_rna_by_name['Standard']
#将mRNA翻译成蛋白质
protein = my_seq.translate(table='Standard')
print protein

shenny!

关注

4
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
python练习题4 将mRNA翻译成蛋白质

题目地址：http://rosalind.info/problems/prot/首先，需要先识别mRNA中的翻译起始位点，即AUG,然后从该位置，根据标准遗传密码表，将整个mRNA序列翻译成蛋白质，如果中途遇到终止密码子，则显示Stop.当然，biopython也提供了翻译蛋白质的模块，可以很方便的将mRNA或者DNA翻译成蛋白质。这是不用biopython的代码：
复制链接

扫一扫