连锁不平衡(linkage disequilibrium,LD)是指在某一个群体中,不同座位上两个基因同时遗传的频率明显高于预期的随机频率现象,连锁不平衡的程度通常用 r2 来衡量。
D是LD的基本单位,度量观察到的单倍型频率与平衡状态下期望频率的计算方法如下:
D=P(AB)-P(A)*P(B)
P(AB)表示实际观察到的AB频率,P(A)*P(B)表示AB频率的期望值。(如果发生连锁不平衡,实际观测到的AB频率肯定不等于AB频率的期望值)
如果D值显著偏离0,则说明存在LD。因为D的取值强烈地依赖于人为制定的等位基因频率,所以它不利于LD程度的比较。标准化的不平衡系数D'能够避免这种对
等位基因频率的依赖。D'的计算方法如下:
D'=D/Dmax
当D<0, Dmax=min{P(A)P(B),P(a)P(b)};
当D>0, Dmax=min{P(A)P(b),P(a)P(B)};
当D‘=1,表示连锁完全不平衡,没有重组;
当D‘=0,表示连锁完全平衡,随机组合;
除了D值之外,还有一个衡量连锁不平衡程度的标准,就是r2
值,计算公式如下
r2=D*D/(P(A)P(a)P(B)P(b))
当r2=1,表示连锁完全不平衡,没有重组
当r2=0,表示连锁完全平衡,随机组合