去除fastq文件中不足四行的

1.下机的fastq文件中四行表示一个reads,但是有的reads 是不足四行的,需要我们去过滤这些reads并且也过滤掉第三行碱基数不等的。下面的python脚本专门处理该fastq文件。

#!/usr/bin/env python
#-*- encoding=UTF-8 -*-
import sys

fa = open(sys.argv[1], "r")
fb = open(sys.argv[1]+".fq", "w")

line_id = 0
for eachline in fa.readlines():
	line_id += 1
	if line_id % 4 == 1:
		read11=eachline.strip()[0]
		if read11!='@':
			line_id=0
			continue
		else:
			read1 = eachline
	elif line_id % 4 == 2:
		read2 = eachline
	elif line_id % 4 == 3:
		read3 = eachline
	else:
		if len(read2)==len(eachline) :	
			fb.write( read1 + read2 + read3 + eachline )
fa.close()
fb.close()

2.使用方法如下:

python /fastq所在的文件的绝对路径

本博主新开公众号, 希望大家能扫码关注一下,十分感谢大家。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值