【基于R语言群体遗传学】-6-表型计算等位基因频率、最大似然估计方法

最新推荐文章于 2025-06-05 17:16:07 发布

tRNA做科研

最新推荐文章于 2025-06-05 17:16:07 发布

阅读量1.6k

点赞数 22

分类专栏：群体遗传学文章标签： r语言开发语言

本文链接：https://blog.csdn.net/qq_51566832/article/details/140169380

版权

到目前为止，我们主要讨论了等位基因和基因型频率，以及我们如何可以从一个推断出另一个。但是，如果我们不知道等位基因频率，只知道种群中存在哪些表型呢？如果我们足够幸运，知道哪些表型对应哪些基因型，我们可以很容易地估计等位基因频率！

前面的内容可以先看我之前的博客内容：群体遗传学_tRNA做科研的博客-CSDN博客

从表型计算等位基因频率

让我们考虑不同的血型作为一个简单的例子。人类通常只能有四种主要的血型：A、B、AB和O。这些血型中的每一个都对应于带有等位基因a、b或i的某种基因型：我们通过下表看一下不同血型对应的基因型

血型	A	B	O	AB
基因型	aa或者ai	bb或者bi	只能是ii	只能是ab

假设我们感兴趣的是找出a、b和i等位基因的比例。我们将使用先前确定的样本个体的血型（表型）（Nikolic等人，2010）我们样本中的表型比例可以通过将每种血型的数量除以个体总数（N）来找到：

AB <- 5
A <- 30
B <- 7
O <- 36
(N <- AB + A + B + O)
A/N
#[1] 0.3846154
B/N
#[1] 0.08974359
AB/N
#[1] 0.06410256
O/N
#[1] 0.4615385

所以，大约38%的样本具有A型血表型，约9%为B型血，仅约6%为AB型血，而大约46%为O型血。这似乎并没有告诉我们太多关于a、b和i等位基因本身的总体频率，但找到表型比例是一个很好的第一步。还记得基于哈代-温伯格比例的预期基因型计算吗？我们已经知道O型血只能有ii基因型，根据哈代-温伯格预测，我们期望ii基因型的数量应该是基础i等位基因频率的平方值（p²i）。因此，假设的i等位基因频率（pi）就是ii基因型总比例的平方根：