pysam

9 篇文章 1 订阅
4 篇文章 0 订阅

仅在Linux上工作

安装:pip install pysam

对于pysam,我是利用fetch方法来查询VCF文件,调用fetch方法需要先对vcf文件建立索引:

/home/user/htslib/htslib-1.14/bgzip -c chr22.dbsnp.noGT.recode.vcf > chr22.dbsnp.noGT.recode.vcf.gz
bcftools index -c chr22.dbsnp.noGT.recode.vcf.gz

然后生成一个csi文件。

python代码如下:

import pysam

f = pysam.VariantFile('/data/user/1000genomes/test/chr22.dbsnp.noGT.recode.vcf.gz')
for rec in f.fetch('22',22449463,23288347):
    print(rec)

最后,仅3s就输出了区间3w2多个位点信息,比起mysql存储花了10.94s快了三倍。
在这里插入图片描述
参考:https://www.cnblogs.com/leezx/p/5908767.html
bgzip安装:
http://www.htslib.org/download/
https://blog.csdn.net/weixin_30471065/article/details/95108525

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值