bcftools相关命令

bcftools主要子命令是index,用于vcf文件的查看、过滤和取子集。-s和-S用于样本筛选,-t和-r(-T, -R)针对染色体区域,-O决定输出文件类型。过滤功能包括内置函数和比较方法,例如基于AC和AN的过滤。示例展示了如何提取特定样本和SNP位点。" 130551565,6727228,湖南美食个人HTML静态网页设计与实现,"['HTML', 'CSS', '网页设计', '课程设计', '美食网站']
摘要由CSDN通过智能技术生成

bcftools最常用的子命令是index,index子命令主要用于对vcf文件进行查看,过滤和取子集。

bcftools view snp.merged.vcf.gz -s C001 -t ^1 -r2,3 -Oz -o snp.chr2_3.vcf.gz

这里来解释一下这些常用参数,-s为取子集用的,这里提取了snp.merged.vcf.gz文件中的样本C001的基因型注释,我们也可以使用-S来读取文件中的样本名称,如下例子

$cat samples
C001
C002
C004
bcftools view -S samples snp.merged.vcf.gz -Oz -o subset.vcf

第二个参数-t/--target和第三个参数-r/--region均是用来提取某个染色体区域的位点的,区别存在如下两点

  1. -t参数可以使用^脱字符来取反,这里-t^1为提取除去1号染色体以外的区段的位点
  2. -t参数在检查indel是否在某个区域时,仅查看开头是否在,而-r参数会检查起始和结束的位置

而我们也可以使用-T和-R来读取文件中的区域信息,这里有一点需要注意的是-R的文件,如果是bed文件,那么程序将视为0-base的,否则视为1-base的文件,文件内容为CHROM POS TOPOS三列内容

输出最常用的参数是-O,它决定了输出文件的类型,一共有4种不同的文件可以做选择,分别是b(compressed bcf),

u(uncompressed bcf),z(compressed vcf)以及v(uncompressed vcf)。而-o则是输出文件的名称

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值