一、Hardy Weinberg定律
在全基因组关联分析的文章中,我们经常会看到作者对待研究的基因位点是否符合遗传平衡定律(又称Hardy Weinberg定律)进行检验。那么为什么要这么做呢?具体的方法和原理又是什么?
遗传平衡定律(又称Hardy Weinberg定律)。意即一个群体符合这种状况,即达到了遗传平衡,也就是一对等位基因的3种基因型的比例分布符合公式:p2+2pq+q2=1,p+q=1,(p+q)2=1.比如对一个含有M和N两种形式的等位基因,基因型MM的频率为p2,NN的频率为q2,MN的频率为2pq。MN:MN:NN=P2:2pq:q2。MN这对基因在群体中达此状态,就是达到了遗传平衡;如果没有达到这个状态,就是一个遗传不平衡的群体。
可以应用卡方检验来验证Hardy-Weinberg遗传平衡,把计算得到的基因频率代入,计算基因型平衡频率,再乘以总人数,求得预期值(e)。把观察数(O)与预期值(E)作比较,进行χ2检验。病例组和对照组的基因型分布的观察值和预期值差异无显著性(P>0.05),符合遗传平衡定律:比如下表为一个具体的Hardy-Weinberg遗传平衡检验:
等位基因C的发生频率为:28.7%+53.6/2%=55.5%
等位基因T的发生频率为:17.7%+53.6/2%=44.5%
根据Hardy-Weinberg定律,P2+2pq+q2=1
则基因型CC的理论值数目是:0.555*0.555*192=59
基因型TT的