python中依次输出字符_Python如何输出某关键字符并输出完整字符串

初学者在尝试编写一个Python脚本来读取FASTA格式的氨基酸序列文件,并计算序列数量以及输出序列名称。目前脚本可以统计序列条数,但在提取序列名称时遇到问题。尝试使用正则表达式进行匹配但导致脚本无法正常运行。序列示例已给出。
摘要由CSDN通过智能技术生成

我初学Python,想要写个计算氨基酸序列长度的Python脚本,自己写了一小段就遇到问题importrefileFa=open("SEQ.FASTA","r")#SEQ.FASTA为氨基酸序列文件countName=0forSeqlineinfileFa....

我初学Python,想要写个计算氨基酸序列长度的Python脚本,自己写了一小段 就遇到问题

import re

fileFa = open("SEQ.FASTA", "r") # SEQ.FASTA为氨基酸序列文件

countName = 0

for Seqline in fileFa.readlines(): #匹配每一行开头是>

reSeqname = re.findall(">", Seqline)

if len(reSeqname) > 0:

countName = countName + reSeqname.count(">")

print "共" + str(countName) + "条序列" #统计共有多少条序列

print "seqname\n" , reSeqname\n

fileFa.close()

现在这个小脚本可以统计出有 几条序列 但是我想输出序列的名字reSeqname就输出的是[ ] 然后我将第五行修改成reSeqname = re.findall(">(.+)", Seqline) 或者是reSeqname = re.findall(">([\w\W]*)", Seqline)脚本就无法运行 不能统计条数了

请大家帮忙修整 最好能解释说明 谢谢

下面是四条氨基酸序列

>qwe56_869

XFSHNYIFFVCVQQLQXSEHIPQKNSPLPFTFLLTKER

>qwe56_44606

KKERDIWTSXAHVTFAKERTQLAYTLRILVHITLSFEQLLEMEIGLAVGGAFLSSALNVLFDRLAPRGELLKMFQRGKHDV

>qwe56_44514

XFLSILKVFTKLTKEHQDMNVNDLAKIIREFISKGGKCLIVLDDVWEPNVVHAIKEAFPKNKKGHRIMITTRDASVARYANAHPHSLKFLKDEESFQ

>qwe56_44424

XITYTLRYILLLLCAETFLFLSHLIMAYAAITSLMNTIQQSMQ

还有个后续问题http://zhidao.baidu.com/question/1924164984543838947.html 也悬赏有分哦

展开

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值