仅在Linux
上工作
安装:pip install pysam
对于pysam
,我是利用fetch
方法来查询VCF
文件,调用fetch
方法需要先对vcf
文件建立索引:
/home/user/htslib/htslib-1.14/bgzip -c chr22.dbsnp.noGT.recode.vcf > chr22.dbsnp.noGT.recode.vcf.gz
bcftools index -c chr22.dbsnp.noGT.recode.vcf.gz
然后生成一个csi
文件。
python
代码如下:
import pysam
f = pysam.VariantFile('/data/user/1000genomes/test/chr22.dbsnp.noGT.recode.vcf.gz')
for rec in f.fetch('22',22449463,23288347):
print(rec)
最后,仅3s
就输出了区间3w2
多个位点信息,比起mysql
存储花了10.94s
快了三倍。
参考:https://www.cnblogs.com/leezx/p/5908767.html
bgzip
安装:
http://www.htslib.org/download/
https://blog.csdn.net/weixin_30471065/article/details/95108525