C/C++/Python读取fasta/fastq文件

最新推荐文章于 2021-06-23 16:39:16 发布

sdulmy

最新推荐文章于 2021-06-23 16:39:16 发布

阅读量1.4k

点赞数

本文链接：https://blog.csdn.net/sdulmy/article/details/103768493

版权

C/C++使用kseq.h，链接时加-lz

#include <string.h>
#include <zlib.h>
#include "kseq.h"

KSEQ_INIT(gzFile, gzread)

//readfile
int main(int argc, char *argv[])
{

    gzFile fp;
    kseq_t *ks;

    fp = gzopen(argv[1],"r");
    if(NULL == fp){
        fprintf(stderr,"Fail to open file: %s\n", argv[1]);
        return 0;
    }

    ks = kseq_init(fp);

    while( kseq_read(ks) >= 0 ){

        fprintf(stderr,"seq: %s\n", ks->seq.s);

    }

    kseq_destroy(ks);
    gzclose(fp);

    return EXIT_SUCCESS;

}

python使用SeqIO

#pip install biopython
from Bio import SeqIO

with open("./clean_total_genomic.fna",'r') as fq:
    for record in SeqIO.parse(fq,'fasta'):
        print(record.seq)

自己写文件处理

使用fileopen，fasta寻找">"，fastq按行处理

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

sdulmy

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
C/C++/Python读取fasta/fastq文件

C/C++使用kseq.h，链接时加-lz#include <string.h>#include <zlib.h>#include "kseq.h"KSEQ_INIT(gzFile, gzread)//readfileint main(int argc, char *argv[]){ gzFile fp; kseq_t *ks; ...
复制链接

扫一扫