连锁不平衡(linkage disequilibrium, LD)分析是群体遗传学研究中常见的分析内容,也是关联分析的基础,在很多的GWAS文章中都会出现LD衰减图及单倍型block图,接下来一起连锁不平衡(linkage disequilibrium, LD)初探。
图1 水稻自然群体连锁不平衡衰减与桃果糖含量位点相关单倍型区块
1、LD的概念
当位于某一座位的特定等位基因与另一座位的某一等位基因同时出现的概率大于群体中因随机分布的两个等位基因同时出现的概率时,称这两个座位处于连锁不平衡状态。
2、LD的计算方法与度量指标
2.1 D值的计算
LD的基本单位是D值,度量观察到的单倍型频率与平衡状态下期望频率的偏差。D值根据单倍型频率必≥0,计算取值范围为[-0.25,0.25]。
D=Pr(A,B)-Pr(A)×Pr(B)
=PAB-PAPB
=PAB-(1-Pa)(1-Pb)
=PAB-(1-Pa-Pb+PaPb)
=PAB-(PA-Pb+PaPb)
=PAB-[PAB+PAb-(PAb