一、文件介绍
1.1 fastq文件介绍:
第一行:以@开头,包含测序信息;
第二行:序列信息
第三行:符号“+”
第四行:序列测序质量文件,具体参考ASCII码
1.2 fasta文件介绍:
第一行:以">"开头,包含fasta序列介绍文件
第二行:序列信息
二、实施思路:
2.1 第一行测序信息,从第二个字符开始,列表切片提取序列名称,打印输出。
2.2 提取第二行序列信息,打印输出。
三、具体代码:
'''用于fastq文件转换成fasta'''
output_file = open(r"H:\python练习\pythonProject2\test.fa","w")
with open(r"H:\python练习\pythonProject2\test.fastq",'r') as input_fastq:
for index,line in enumerate(input_fastq):
if index % 4 == 0: #打印标题
output_file.write(">" + line.strip()[1:] + "\n")
elif index % 4 == 1: #打印序列,且每40输出一行
for i in range(0,len(line.strip()),40):
output_file.write(line.strip()[i:i+40] + "\n")
elif index % 4 == 2:
continue
elif index % 4 == 3:
continue