简介
根据我的了解,这个库主要用来读取bed文件,以下在我的使用过程中整理出来的说明
由于bam bed文件比较大,pysam处理起来十分缓慢,因此需要使用C语言来处理。
读取文件
hts_open("filename_gz","r") 读bed文件
tbx_index_load("tbi_filename") 读索引文件
查询
sprintf(reg,"%s:%d-%d",chr,pos,pos);
hts_itr_t *itr = tbx_itr_querys(bed->tbx,reg) 查询区域里的bed区间
迭代
tbx_itr_next(bed->fp,bed->tbx,itr, &bed->ks) 会将查询到的区间挨个迭代,保存到bed->ks.s
item->chr = strtok_r(bed->ks.s, "\t", &save);
item->beg = atoi(strtok_r(NULL, "\t", &save));
item->end = atoi(strtok_r(NULL, "\t", &save));
示例代码:
#include <htslib/tbx.h>
#include <htslib/faidx.h>
typedef struct
{
htsFile *fp; //文件
tbx_t *tbx