基因序列变异信息VCF (Variant Call Format)

<~生~信~交~流~与~合~作~请~关~注~公~众~号@生信探索> VCF是Variant Call Format的简称,是一种定义的专门用于存储基因序列突变信息的文本格式。在生物信息分析中会大量用到VCF格式。例如基因组中的单碱基突变,SNP, 插入/缺失INDEL, 拷贝数变异CNV,和结构变异SV等,都是利用VCF格式来存储的。将其存储为二进制格式就是BCF。

VCF文件包括了两部分

第一部分是#开头的注释行称为header

包括版本信息,物种,生成这个文件所使用的命令,参考基因组信息等。

第二部分是以TAB分割的列称为records,前7列必须存在,可以用.表示空值

第1列:CHROM

chromosome;染色体名称或contig名称;

第2列:POS

position;参考基因组突变碱基位置,如果是INDEL,位置是INDEL的第一个碱基位置;

第3列:ID

dentifier; 突变的名称,比如dbSNP的名字

第4列:REF

reference base(s);参考染色体的碱基

第5列:ALT

alternate base(s; 与参考序列比较,发生突变的碱基,可以有多个值,每个值用逗号分隔

第6列:QUAL

quality;Phred标准下的质量值,表示该变异位点的可靠性,可以理解为所call出来的变异位点的质量值。Q=-10lgP,Q表示质量值;P表示这个位点发生错误的概率。因此,如果想把错误率从控制在90%

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值