我初学Python,想要写个计算氨基酸序列长度的Python脚本,自己写了一小段 就遇到问题
import re
fileFa = open("SEQ.FASTA", "r") # SEQ.FASTA为氨基酸序列文件
countName = 0
for Seqline in fileFa.readlines(): #匹配每一行开头是>
reSeqname = re.findall(">", Seqline)
if len(reSeqname) > 0:
countName = countName + reSeqname.count(">")
print "共" + str(countName) + "条序列" #统计共有多少条序列
print "seqname\n" , reSeqname\n
fileFa.close()
现在这个小脚本可以统计出有 几条序列 但是我想输出序列的名字reSeqname就输出的是[ ] 然后我将第五行修改成reSeqname = re.findall(">(.+)", Seqline) 或者是reSeqname = re.findall(">([\w\W]*)", Seqline)脚本就无法运行 不能统计条数了
请大家帮忙修整 最好能解释说明 谢谢
下面是四条氨基酸序列
>qwe56_869
XFSHNYIFFVCVQQLQXSEHIPQKNSPLPFTFLLTKER
>qwe56_44606
KKERDIWTSXAHVTFAKERTQLAYTLRILVHITLSFEQLLEMEIGLAVGGAFLSSALNVLFDRLAPRGELLKMFQRGKHDV
>qwe56_44514
XFLSILKVFTKLTKEHQDMNVNDLAKIIREFISKGGKCLIVLDDVWEPNVVHAIKEAFPKNKKGHRIMITTRDASVARYANAHPHSLKFLKDEESFQ
>qwe56_44424
XITYTLRYILLLLCAETFLFLSHLIMAYAAITSLMNTIQQSMQ
还有个后续问题http://wenwen.sogou.com/z/q704123807.htm 也悬赏有分哦