【基于R语言群体遗传学】-6-表型计算等位基因频率、最大似然估计方法

到目前为止,我们主要讨论了等位基因和基因型频率,以及我们如何可以从一个推断出另一个。但是,如果我们不知道等位基因频率,只知道种群中存在哪些表型呢?如果我们足够幸运,知道哪些表型对应哪些基因型,我们可以很容易地估计等位基因频率!

前面的内容可以先看我之前的博客内容:群体遗传学_tRNA做科研的博客-CSDN博客

从表型计算等位基因频率

让我们考虑不同的血型作为一个简单的例子。人类通常只能有四种主要的血型:A、B、AB和O。这些血型中的每一个都对应于带有等位基因a、b或i的某种基因型:我们通过下表看一下不同血型对应的基因型

血型 A B O AB
基因型 aa或者ai bb或者bi 只能是ii 只能是ab

假设我们感兴趣的是找出a、b和i等位基因的比例。我们将使用先前确定的样本个体的血型(表型)(Nikolic等人,2010)我们样本中的表型比例可以通过将每种血型的数量除以个体总数(N)来找到:

AB <- 5
A <- 30
B <- 7
O <- 36
(N <- AB + A + B + O)
A/N
#[1] 0.3846154
B/N
#[1] 0.08974359
AB/N
#[1] 0.06410256
O/N
#[1] 0.4615385

所以,大约38%的样本具有A型血表型,约9%为B型血,仅约6%为AB型血,而大约46%为O型血。这似乎并没有告诉我们太多关于a、b和i等位基因本身的总体频率,但找到表型比例是一个很好的第一步。还记得基于哈代-温伯格比例的预期基因型计算吗?我们已经知道O型血只能有ii基因型,根据哈代-温伯格预测,我们期望ii基因型的数量应该是基础i等位基因频率的平方值(p²i)。因此,假设的i等位基因频率(pi)就是ii基因型总比例的平方根:

(Pi <- sqrt(O/N))

请注意,我们只是从关注O型血表型开始,虽然A型和B型血表型也包含一定比例的i等位基因作为ai和bi杂合子,但我们理论上预期的ii纯合子数量不会受到另外两个等位基因“隐藏”i等位基因作为杂合子这一事实的影响。

请记住,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

tRNA做科研

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值