>TRINITY_DN3760_c0_g2_i1 len=284 path=
这是一个一个fasta文件的示例。
这个文件中,TRINITY_DN3760_c0_g2是基因名。
没错,TRINITY_DN3760_c0_g2和TRINITY_DN3760_c1_g2是不同的基因。
而i1,i2是不同的转录本,现在要找出一个基因唯一最长的那个转录本,短的都不要。
# 17.8.11
import os
import re
os.chdir("c:/")
def readfasta(filename):
fa = open(filename, 'r')