参考资料链接
安装vcfR
直接通过install.packages()函数就可以安装
install.packages("vcfR")
vcfR简介vcfR is a package intended to help visualize, manipulate and quality filter data in VCF file.
vcf格式文件
利用各种测序数据检测变异的结果存储文件,简单划分vcf格式文件里的内容 - ‘#’号开头行 - 非#号开头行
vcfR包存储vcf文件分为三个部分 - ‘#’号开头行——meta - 非#号开头行分为fix和gt两个部分
fix部分存储vcf文件中非#号开头行的前7列,分别是染色体编号
碱基位置
ID
参考碱基
变异碱基
质量值
是否过滤
gt 部分存储两部分内容format
样本基因型
本文的数据使用 pinf_sc50.vcf.gz 来自R包 pinfsc50
读入数据
vcf
可以通过@符号获取meta、fix、gt三部分数据
vcf@meta
vcf@fix
vcf@gt
另外一些操作数据的操作
queryMETA(vcf,element="AD")
getFIX(vcf)[1:2,1:7]
vcf@gt[1:5,1:7]
gt
gt[1:2,1:7]
结合基因组注释文件对数据进行展示
install.packages("ape")
library(ape