Hardy-Weinberg equilibrium
- 因为有需要计算HWE中的p-value,所以查找了一些资料,在这整理纪录一下(楼下有出处链接)。
1. 概念
“哈迪-温伯格定律”是指在理想状态下,各等位基因的频率和等位基因的基因型频率在遗传中是稳定不变的,即保持着基因平衡。
遗传平衡定律(又称Hardy Weinberg定律)。意即一个群体符合这种状况,即达到了遗传平衡,也就是一对等位基因的3种基因型的比例分布符合公式:p2+2pq+q2=1,p+q=1,(p+q)2=1.基因型MM的频率为p2,NN的频率为q2,MN的频率为2pq。MN:MN:NN=P2:2pq:q2。MN这对基因在群体中达此状态,就是达到了遗传平衡。如果没有达到这个状态,就是一个遗传不平衡的群体。但随着群体中的随机交配,将会保持这个基因频率和基因型分布比例,而较易达到遗传平衡状态。
应用Hardy-Weinberg遗传平衡吻合度检验方法,把计算得到的基因频率代入,计算基因型平衡频率,再乘以总人数,求得预期值(e)。把观察数(O)与预期值(e)作比较,进行χ2检验。病例组和对照组的基因型分布的观察值和预期值差异无显著性(P>0.05),符合遗传平衡定律。
2. 步骤和例子
eg1
2.1 三个基因类型(genotype)实际数(O):
AA—AB—BB
1787 3039 1303 总数 N=6129
2.2 等位(allele)频率
F(A) = (1787 + 3039/2) / 6129 = 0.54 = p
F(B ) = (1303 + 3039/2) / 6129 = 0.46 = q … and S(p,q)=1
2.3 期待genotype频率:
期待AA 频率: p2 = (0.54)2 = 0.2916
期待AB频率: 2pq = 2x 0.54 x 0.46 = 0.4968
期待BB 频率: q2 = (0.46)2 = 0.2116
2.4 期待genotype数 (Q):
期待AA : p2N = 0.2916 x 6129 = 1787.2
期待AB : 2pqN = 0.4968 x 6129 = 3044.9
期待BB : q2N = 0.2116 x 6129 = 1296.9
2.5 卡方值
χ2=(O(AA)−Q(AA))2Q(AA)+(O(AB)−Q(AB))2Q(AB)+(O(BB)−Q(BB))2Q(BB)
χ
2
=
(
O
(
A
A
)
−
Q
(
A
A
)
)
2
Q
(
A
A
)
+
(
O
(
A
B
)
−
Q
(
A
B
)
)
2
Q
(
A
B
)
+
(
O
(
B
B
)
−
Q
(
B
B
)
)
2
Q
(
B
B
)
其中O代表观察值(即实际值),Q代表期待值
2.6 求p-value值
再根据 χ2 χ 2 求出p-value值!!!
eg2
基因型 数目(人) 基因型频率
CC 55 28.7%
CT 103 53.6%
TT 34 17.7%
等位基因C的发生频率为:28.7%+53.6/2%=55.5%
等位基因T的发生频率为:17.7%+53.6/2%=44.5%
根据Hardy-Weinberg定律,P2+2pq+q2=1
则基因型CC的理论值数目是:0.555*0.555*192=59
基因型TT的理论值数目是: 0.445*0.445*192=38
基因型CT的理论值数目是: 2*0.555*0.445*192=95
X2=∑(A-T)2/T=(55-59)2/59+(34-38)2/38+(103-94)2/94
=1.4174
按自由度=2,查X2界值表,P>0.05,因而不能认为这两组数据有显著性差别,也即该样本达到了遗传平衡。
参考链接:
1. http://www.dxy.cn/bbs/thread/223387#223387
2. http://scienceprimer.com/hardy-weinberg-equilibrium-calculator
3. http://blog.sciencenet.cn/home.php?mod=space&uid=723765&do=blog&id=639882
4. http://www.sohu.com/a/215228126_301099