VAF:Variant Allel Frequency简介

欢迎关注”生信修炼手册”!

VAF是Variant Allel Frequency的缩写,通常称之为变异等位基因频率, 计算公式如下

从公式上看,描述的是突变的allel对应的reads数目占该位点所有read数目的比例,在VCF文件中,通常以AD这个字段表示allel的测序深度,多个allel的测序深度用逗号连接,DP表示该位点总的测序深度, 举例如下

AD = 4,8
DP = 12

AD这个字段有4和8两个allel, 在二倍体生物中,第一个数字代表ref allel的测序深度,第二个数字代表alt  allel的测序深度,所以该位点在该样本中的VAF=8/12。

对于突变位点而言,还有一个频率,称之为MAF, 全称是Minor Allel Frequency, 描述的是次等位基因在人群中的频率,从这里也可以看出VAF和MAF的不同支持,这两个概念都是针对allel 频率而言的,MAF描述的是allel在人群中的频率,而VAF描述的是allel在某个样本中的频率。

VAF的值的大小有什么含义呢?以二倍体生物为例,假设所有的细胞中该位点都是杂合的,那么50%的染色体上包含了ref allel, 另外50%的染色体上包含了alt allel, 则测序结果中该位点的VAF值应该为0.5。对于germline genotype而言,一个可靠的突变位点其VAF的值应该在0.5附近。

如果VAF偏离0.5很多,说明对应的染色体区域在细胞中不在是两拷贝了,比如VAF的值为0.25, 说明包含alt allel的染色体占1/4, ref allel的染色体占3/4, 按照所有细胞突变情况完全一致的假设,只有当每个细胞中出现了三份拷贝,两份拷贝是ref allel, 一份拷贝是alt allel时,会出现0.25的情况。

对于生殖变异的检测,认为其VAF的偏移来源于拷贝数的变化,对于体细胞检测而言,更多的认为VAF的偏移来源于肿瘤细胞的异质性。在肿瘤组织取样时,不可避免的会混入正常的体细胞,而且考虑到肿瘤微环境本身的复杂性,在肿瘤组织中也会浸润诸如免疫细胞等其他细胞类型,肿瘤细胞本身也可以划分为不同的亚型,考虑到以上种种因素,肿瘤样本是一个多种细胞类型的混合物,更多的认为其VAF的偏移来源于不同细胞类型占比的变化。

在进一步简化这个模型,将肿瘤样本划分为正常体细胞和肿瘤细胞两种,ref allel等于正常细胞x2 + 肿瘤细胞, alt allel 等于肿瘤细胞,VAF的值就可以反映肿瘤细胞和正常细胞的比例,可以用来推测肿瘤纯度。在肿瘤基因组研究中,还会将VAF当做一个marker, 取样本中所有位点VAF的均值当做一个指标,可以比较不同分组,不同肿瘤中VAF分布的差异,也可以根据VAF的高低将样本分组进行生存分析。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

  • 6
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值