基因数据处理26之bcftools安装和使用

1.下载:

https://github.com/samtools/bcftools

2.安装
make
make install

3.结合samtools使用
对排序好的bam数据用samtools生成bcf文件:

xubo@xubo:~/xubo/data/testTools/se$ samtools mpileup -ugf ../hs38DH.fa hs2.sort.bam  >hs2.bcf

由于生成的是二进制格式的数据,需要进行解析或者转换成vcf:

xubo@xubo:~/xubo/data/testTools/se$ bcftools view hs2.bcf >hs2.vcf

vcf查看:

##INFO=<ID=MQ0F,Number=1,Type=Float,Description="Fraction of MQ0 reads (smaller is better)">
##INFO=<ID=I16,Number=16,Type=Float,Description="Auxiliary tag used for calling, see description of bcf_callret1_t in bam2bcf.h">
##INFO=<ID=QS,Number=R,Type=Float,Description="Auxiliary tag used for calling">
##FORMAT=<ID=PL,Number=G,Type=Integer,Description="List of Phred-scaled genotype likelihoods">
##bcftools_viewVersion=1.3.1-15-g7c7c7a2+htslib-1.3.1-35-g481752c
##bcftools_viewCommand=view hs2.bcf
#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT  hs2.sort.bam
chrUn_KN707963v1_decoy  15790   .       T       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,0,0,0,0;QS=1,0;MQ0F=0   PL      0,3,17
chrUn_KN707963v1_decoy  15791   .       G       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,1,1,0,0;QS=1,0;MQ0F=0   PL      0,3,17
chrUn_KN707963v1_decoy  15792   .       A       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,2,4,0,0;QS=1,0;MQ0F=0   PL      0,3,17
chrUn_KN707963v1_decoy  15793   .       T       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,3,9,0,0;QS=1,0;MQ0F=0   PL      0,3,17
chrUn_KN707963v1_decoy  15794   .       T       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,4,16,0,0;QS=1,0;MQ0F=0  PL      0,3,17
chrUn_KN707963v1_decoy  15795   .       C       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,5,25,0,0;QS=1,0;MQ0F=0  PL      0,3,17
chrUn_KN707963v1_decoy  15796   .       C       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,6,36,0,0;QS=1,0;MQ0F=0  PL      0,3,17
chrUn_KN707963v1_decoy  15797   .       A       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,7,49,0,0;QS=1,0;MQ0F=0  PL      0,3,17
chrUn_KN707963v1_decoy  15798   .       T       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,8,64,0,0;QS=1,0;MQ0F=0  PL      0,3,17
chrUn_KN707963v1_decoy  15799   .       T       A,<*>   0       .       DP=1;I16=0,0,1,0,0,0,17,289,0,0,37,1369,0,0,9,81;QS=0,1,0;SGB=-0.379885;MQ0F=0  PL      17,3,0,17,3,17
chrUn_KN707963v1_decoy  15800   .       C       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,10,100,0,0;QS=1,0;MQ0F=0        PL      0,3,17
chrUn_KN707963v1_decoy  15801   .       C       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,11,121,0,0;QS=1,0;MQ0F=0        PL      0,3,17
chrUn_KN707963v1_decoy  15802   .       A       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,12,144,0,0;QS=1,0;MQ0F=0        PL      0,3,17
chrUn_KN707963v1_decoy  15803   .       T       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,13,169,0,0;QS=1,0;MQ0F=0        PL      0,3,17
chrUn_KN707963v1_decoy  15804   .       T       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,14,196,0,0;QS=1,0;MQ0F=0        PL      0,3,17
chrUn_KN707963v1_decoy  15805   .       C       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,15,225,0,0;QS=1,0;MQ0F=0        PL      0,3,17
chrUn_KN707963v1_decoy  15806   .       C       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,16,256,0,0;QS=1,0;MQ0F=0        PL      0,3,17
chrUn_KN707963v1_decoy  15807   .       C       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,17,289,0,0;QS=1,0;MQ0F=0        PL      0,3,17
chrUn_KN707963v1_decoy  15808   .       G       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,18,324,0,0;QS=1,0;MQ0F=0        PL      0,3,17
chrUn_KN707963v1_decoy  15809   .       T       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,19,361,0,0;QS=1,0;MQ0F=0        PL      0,3,17
chrUn_KN707963v1_decoy  15810   .       C       <*>     0       .       DP=1;I16=1,0,0,0,17,289,0,0,37,1369,0,0,20,400,0,0;QS=1,0;MQ0F=0        PL      0,3,17

vcftools还不知道干嘛的

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: bcftools是一个广泛使用的命令行工具,用于处理VCF格式的变异调用数据。它支持检查,过滤,转换和合并VCF文件。利用bcftools可以生成高保真度和高质量的系统发育树。 构建系统发育树必须先生成一个vcf文件。在vcf文件中,包含了每个样品在每个位置上的碱基。然后,可以使用bcftools进行变异的过滤和筛选,以过滤掉低质量的碱基以及不太可靠的变异。 在变异筛选之后,可以使用bcftools将过滤后的vcf文件转换为phylip格式。phylip是一种用于构建系统发育树的标准格式。然后,利用phylip格式的文件和其他的支持文件,可以使用常规的系统发育树软件,如RAxML和PhyML,构建系统发育树。 总之,bcftools是一个非常有用的工具,能够对VCF格式的变异调用数据进行全面处理,并可以生成高质量的系统发育树。它对于分子生物学和生物信息学研究都是非常重要的工具。 ### 回答2: BCFTools是一个非常流行的工具,可以用于处理VCF文件并构建系统发育树。使用BCFTools处理VCF文件有很多好处,例如可以过滤VCF文件中无用的信息,筛选出感兴趣的位点等。 要使用BCFTools构建系统发育树,我们需要先将VCF文件中的数据转换成BCF文件。这可以通过使用bcftools view命令将VCF文件转换成BCF文件来完成。然后,我们需要使用bcftools query命令从BCF文件中提取需要的信息,例如基因型、SNP位点等。可以使用bcftools filter命令在提取信息的同时进行一些筛选操作,例如过滤掉低质量的位点、过滤掉缺失值等。 最后,在得到所需的信息后,我们可以使用构建系统发育树所需的软件,例如PHYLIP等,将提取的信息输入到软件中进行分析和构建系统发育树。 总之,使用BCFTools处理VCF文件可以大大简化系统发育树的构建过程,提高分析效率和准确性。但是,需要注意保证数据质量和正确性,以避免结果出错。 ### 回答3: BCFtools是一种用于处理VCF和BCF文件的工具集,可以用于构建系统发育树。通过将多个样品的VCF文件合并以构建总体样本的VCF文件,可以使用BCFtools执行操作,例如基因型过滤、缺失数据的填充以及变异注释。 构建系统发育树需要将样品的遗传差异映射到树形结构中,以显示它们的亲缘关系。一种构建方法是使用多序列比对将DNA序列对齐,然后执行基于序列比较的树形建构分析。另一种方法是使用变异的相对频率或一些组合遗传标志,例如单倍体基因型的分布来建构系统发育树。这种数据分析方法称为分子系统学。 使用BCFtools进行VCF文件处理时,可以考虑以下步骤: 1)使用bcftools merge命令将多个样本的VCF文件合并成一个总体VCF文件。 2)使用bcftools view命令执行过滤,例如基因型和质量过滤,以减少噪音和杂质信号。 3)使用bcftools stats命令生成统计信息,例如变异密度、每个样本的基因型频率和分布的质量值等。 4)使用vcftools或其他变异注释工具添加有关变异和功能信息,例如GenBank注释、GO注释、KEGG通路注释等。 5)使用获得的信息对变异进行系统发育推断,以判断样本之间的亲缘关系、进化史和分化历史。常见的分化历史分析方法包括最大简约树、相似度矩阵分析、邻接成对绘制等分子系统学方法。 综上所述,BCFtools是一种有用的工具集,可以处理VCF文件和构建系统发育树,并帮助科学家了解样本之间的遗传相似性和进化历史。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值