Rosalind第22题:RNA Splicing

Problem

After identifying the exons and introns of an RNA string, we only need to delete the introns and concatenate the exons to form a new string ready for translation.

Given: A DNA string  (of length at most 1 kbp) and a collection of substrings of  acting as introns. All strings are given in FASTA format.

Return: A protein string resulting from transcribing and translating the exons of . (Note: Only one solution will exist for the dataset provided.)

识别RNA字符串的外显子和内含子后,我们只需要删除内含子并连接外显子即可形成一个新的字符串,准备翻译。

下式给出:DNA串 (长度的至多1 kbp的)和的集合的子串 的作为内含子。所有字符串均以FASTA格式给出。

返回值:转录和翻译的外显子所产生的蛋白质串。(注意:对于提供的数据集,仅存在一种解决方案。)

Sample Dataset

>Rosalind_10
ATGGTCTACATAGCTGACAAACAGCACGTAGCAATCGGTCGAATCTCGAGAGGCATATGGTCACATGATCGGTCGAGCGTGTTTCAAAGTTTGCGCCTAG
>Rosalind_12
ATCGGTCGAA
>Rosalind_15
ATCGGTCGAGCGTGT

Sample Output

MVYIADKQHVASREAYGHMFKVCA

python解决方案

codon_table =  {'UUU': 'F', 'CUU': 'L', 'AUU': 'I', 'GUU': 'V', \
                 'UUC': 'F', 'CUC': 'L', 'AUC': 'I', 'GUC': 'V', \
                 'UUA': 'L', 'CUA': 'L', 'AUA': 'I', 'GUA': 'V', \
                 'UUG': 'L', 'CUG': 'L', 'AUG': 'M', 'GUG': 'V', \
                 'UCU': 'S', 'CCU': 'P', 'ACU': 'T', 'GCU': 'A', \
                 'UCC': 'S', 'CCC': 'P', 'ACC': 'T', 'GCC': 'A', \
                 'UCA': 'S', 'CCA': 'P', 'ACA': 'T', 'GCA': 'A', \
                 'UCG': 'S', 'CCG': 'P', 'ACG': 'T', 'GCG': 'A', \
                 'UAU': 'Y', 'CAU': 'H', 'AAU': 'N', 'GAU': 'D', \
                 'UAC': 'Y', 'CAC': 'H', 'AAC': 'N', 'GAC': 'D', \
                 'UAA': 'Stop', 'CAA': 'Q', 'AAA': 'K', 'GAA': 'E', \
                 'UAG': 'Stop', 'CAG': 'Q', 'AAG': 'K', 'GAG': 'E', \
                 'UGU': 'C', 'CGU': 'R', 'AGU': 'S', 'GGU': 'G', \
                 'UGC': 'C', 'CGC': 'R', 'AGC': 'S', 'GGC': 'G', \
                 'UGA': 'Stop', 'CGA': 'R', 'AGA': 'R', 'GGA': 'G', \
                 'UGG': 'W', 'CGG': 'R', 'AGG': 'R', 'GGG': 'G'
                 }
def readfasta(lines):
    seq = []
    index = []
    seqplast = ""
    numlines = 0
    for i in lines:
        if '>' in i:
            index.append(i.replace("\n", "").replace(">", ""))
            seq.append(seqplast.replace("\n", ""))
            seqplast = ""
            numlines += 1
        else:
            seqplast = seqplast + i.replace("\n", "")
            numlines += 1

        if numlines == len(lines):
            seq.append(seqplast.replace("\n", ""))
    seq = seq[1:]
    return index, seq


def translation(seq):
    i = 0
    p = ""
    while i < len(seq)/3 - 1:
        n = seq[3 * i] +seq[3*i+1] + seq[3*i+2]
        r = codon_table[n]
        i += 1
        p = p + r
    return p

f = open('rosalind_splc.txt', 'r')
lines = f.readlines()
f.close()
(index, seq) = readfasta(lines)

totlaseq = seq[0]

introns = seq[1:]

for line in introns:
    n = len(line)
    i = 0
    while i < len(totlaseq) - n + 1:
        subseq = totlaseq[i:i + n] # 逐个扫描长度与内含子相同的序列
        if subseq == line: # 若找到内含子
            newseq = totlaseq[:i] + totlaseq[i + n:] # 用新字符串存储去掉内含子的部分
            totlaseq = newseq # 用新串取代老串
        i += 1
rnaseq = totlaseq.replace('T', 'U')
protein = translation(rnaseq)
print(protein)
f = open('output.txt', 'w')

f.write(protein)

f.close()

 

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
毕业设计,基于SpringBoot+Vue+MySQL开发的体育馆管理系统,源码+数据库+毕业论文+视频演示 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本体育馆管理系统就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据信息,使用这种软件工具可以帮助管理人员提高事务处理效率,达到事半功倍的效果。此体育馆管理系统利用当下成熟完善的SpringBoot框架,使用跨平台的可开发大型商业网站的Java语言,以及最受欢迎的RDBMS应用软件之一的Mysql数据库进行程序开发。实现了用户在线选择试并完成答,在线查看考核分数。管理员管理收货地址管理、购物车管理、场地管理、场地订单管理、字典管理、赛事管理、赛事收藏管理、赛事评价管理、赛事订单管理、商品管理、商品收藏管理、商品评价管理、商品订单管理、用户管理、管理员管理等功能。体育馆管理系统的开发根据操作人员需要设计的界面简洁美观,在功能模块布局上跟同类型网站保持一致,程序在实现基本要求功能时,也为数据信息面临的安全问提供了一些实用的解决方案。可以说该程序在帮助管理者高效率地处理工作事务的同时,也实现了数据信息的整体化,规范化与自动化。 关键词:体育馆管理系统;SpringBoot框架;Mysql;自动化
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值