from Bio import SeqIO
s= SeqIO.read("酿酒酵母S288Cv染色体基因序列.fasta","fasta")
sequence = s.seq
print()
print("查找酿酒酵母v染色体基因TATA框")
print()
print("酿酒酵母v染色体基因")
print(s.format("fasta"))
print()
print("基因序列长度:"+str(len(sequence)))
def index_TA(seq1,seq2):
"""
:param seq1: 待查找的字符串(TATA框)
:param seq2: 基因序列
:return: 所有所在位置的索引列表
"""
index_list =[]
i = 0
while seq1 in seq2[i:]:
index_seq = seq2.find(seq1,i)
index_list.append(index_seq)
i = index_seq + len(seq1)
return index_list
def print_TA(sequence,index_list):
"""
:param sequence: 基因序列
:param index_list: TATA框所在位置索引
打印TATA框碱基组成及其位置
"""
seq1 = "TATA"
print("-" * 22)
print("TATA框\t 所在位置(bp)")
for index in index_list:
# print(sequence[index:index+len(seq1)+3])
print("{}\t -{:d}~-{:d}".format(sequence[index:index + len(seq1) + 3], index, index + len(seq1) + 3))
print("-" * 22)
if __name__ == '__main__':
seq1 = "TATA"
# TATA框架所在位置
index_list = index_TA(seq1, sequence)
# 打印TATA碱基组成及其位置
print_TA(sequence,index_list)
查找酿酒酵母v染色体基因TATA框
于 2020-10-02 22:00:16 首次发布