python 从fastq文件中挑选出序列长度在规定范围的序列

本文介绍如何使用Python编写一个名为fq_filter.py的程序,该程序读取FASTQ文件并过滤出碱基序列长度在60到80之间的序列,将符合条件的序列写入新的FASTQ文件。程序利用optparse模块处理命令行参数,并遵循FASTQ文件的四行一组格式。通过指定的-infile和-outfile参数,用户可以指定输入和输出文件名。
摘要由CSDN通过智能技术生成

要求:

FASTQ文件长度过滤:编写一个程序,读取FASTQ文件,过滤掉碱基序列长度在60-80之外的序列,将长度在60-80之内的序列输出到结果文件中。

FASTQ格式文件如下:每四行表示一个测序序列,第二行是碱基序列。

@M2,HWI-7001455:326:HGTFVADXX:1:1101:2666:105721:N:0:GCGCTA

TTTAGTTTTGTAGTAATTGTTTGTAGTAAAATTTGTATTAGTTTTTTTATTTGTA

+

CCCFFFDDHHFHHIJJJJJHHIJJJJIIGEIJIJJIIJJJJHIJJJJJIJIJIHI


编程要求如下:

1)      程序命名为fq_filter.py

2)      程序采用optparse从命令行输入,参数共有3个,-infile,-outfile,-h;

3)      其中-infile用于接收输入的FASTQ文件名;

4)      -outfile用于给出符合条件的结果文件名,输出结果格式要与输入的FASTQ格式相同。

5)      -h用于给出程序的使用说明;


fq_filter.py

#!/usr/bin/python
from optparse import OptionParser


parser = OptionParser()
parser.add_option("--infile", dest="infile", help="give a fasta fil

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值