Wright–Fisher 群体模型 特征、拓展及模拟软件

Wright-Fisher (WF) 模型特征

  1. 群体大小有限,恒定为 N N N
  2. 世代间离散、非重叠 。离散是指子代同时一起出现,并非连续不断的出现。非重叠是指第 n n n 代的个体不会遗留到 n + 1 n+1 n+1 代。可以理解为:群体内亲代同时产生了子代,当子代出现时,亲代个体全部消失。保证了 世代之间互不干扰 ,可以将 世代间遗传 的过程视为一个 马尔可夫链
  3. 个体之间随机交配 。通过从第 n n n 代单倍型中随机有放回的抽样,得到第 n + 1 n+1 n+1 代的单倍型。如位点 S S S 在群体中有两种不同的等位基因 A A A a a a ,第 n n n 代的频数分别为 i i i N − i N-i Ni 。若假设第 n + 1 n+1 n+1 代的等位基因 A A A 的频数为 j j j ,这种情况的概率为:
    p i j = C N j ( i / N ) j ( 1 − i / N ) N − j , 0 ≤ i , j ≤ N p_{ij}=C^j_N(i/N)^j(1-i/N)^{N-j}, 0≤i,j≤N pij=CNj(i/N)j(1i/N)Nj,0i,jN
    因为世代间遗传过程可以视为马尔可夫链,并且每代中等位基因 A A A 的任意频数值情况 [ 0 , N ] [0, N] [0,N] 在理论上均存在,所以位点 S S S 在世代间频数变化的概率可以组成 转移概率矩阵 P = ( p i j ) P=(p_{ij}) P=(pij)

注意 Wright-Fisher 模型仅考虑单个位点的情况,不考虑 多个位点间的重组、选择压力、性别、个体迁入迁出、群体内年龄结构 等因素。



Wright-Fisher (WF) 拓展


1. 重组

  1. 重组发生在形成配子前。
  2. 假设每个位点每代发生重组的概率是 r r r ,从一个重组点开始,重组点后 x x x 个位点都不发生重组,第 x + 1 x+1 x+1 个位点发生重组的概率为: P ( L = x ) = r ( 1 − r ) x P(L=x)=r(1-r)^x P(L=x)=r(1r)x
  3. 当重组发生时,会从群体中剩余染色体中随机选取一个染色体进行拼接。每发生一次重组便进行一次染色体拼接。

2. 选择

  1. 虽然不同基因发挥功能的时期不同,但为了简化, Wright-Fisher 模型中统一将所有 基因的作用 转化为对 个体繁殖机会的影响,引入 适应度(Fitness) 概念。适应度是指某个群体内某种基因型个体存活并将其基因传递至下一代的相对能力(与其他基因型比较)。适合度越大,生殖机会越高
  2. 各染色体等概率被抽取 修改为 染色体抽取概率与适应度成正比 。如位点 S S S 上有两种基因型 A A A a a a,其中 A A A 会使个体更为强壮;在自然环境中携带 A A A 基因型的个体更易存活到性成熟并在配偶的争斗中获胜;所以简化后, A A A 相比 a a a 有更大的概率将基因型传递至下一代,即 A A A a a a 具有更高的适应度, A A A 被抽取的概率高于 a a a

3. 迁入迁出

  1. Wright-Fisher 模型中迁入迁出被设定发生在子代产生之前,根据迁入迁出的比例从集合中随机挑选。如 p1 群体 500 个,p2 群体 1000 个,p1 -> p2 的迁移率为 0.2,p2 -> p1 的迁移率是 0.3;则从 p1 中随机抽取 100 个个体,从 p2 中随机抽取 300 个个体;迁移完成后 p1 群体 700 个,p2 群体 800 个。



Wright-Fisher (WF) 模拟软件 SLiM

SLiM(Selection on Linked Mutations)是一款可用于模拟 Wright-Fisher 和 Non-Wright-Fisher 模型群体世代变化的软件。这里主要介绍 SLiM 模拟 Wright-Fisher 模型群体世代的流程,进一步提升对 Wright-Fisher 模型的理解。下面内容摘自 SLiM: An Evolutionary Simulation FrameworkChapters 22. SLiM architecture (WF models) ,书 P 503-510。

  1. 确定亲本集 。根据迁入迁出比例,群体移除或添加相应数量的个体。
  2. 获得亲本 。从群体中随机抽取个体作为亲本,每个亲本被抽取的概率与适应度成正比。如果子代的产生需要双亲本,则分两轮分别抽取父本集、母本集,根据抽取的对应顺序组成亲本对。
  3. 生成新突变 。根据不同类型突变的突变率及所在区间,在基因组上产生对应的新突变。如基因组总区间大小 200kb,其中 99-100kb 区间包含基因;假设基因区间的突变会降低染色体的适应度,突变率 10e-9,而其余非基因区间的突变视为中性突变,突变率 10e-7;突变发生次数符合泊松分布,SLiM 根据概率分布计算出每个亲本染色体上两类突变的新突变数量;新突变的位置是对应区间内的随机数。
  4. 重组 。因为之前已经确定了每个子代的亲本对,所以重组发生在个体的同源染色单体之间。重组位点的数量及位置的计算方式与突变相同,数量根据泊松分布得到,位置是区间内的随机数。
  5. 生成子代 。根据父母本基因组生成子代及其基因组,如果个体包含性别,则按比例为子代赋予性别。接着,从子代个体集中删去包含致死基因型的子代,然后按照上述 2-5 步骤重新生成删除数量的子代,性别比与删除的子代相同。直到所有子代均不包含致死基因。
  6. 计算子代相对适应度。除去已固定的突变位点,个体适应度等于基因组所携带的全部突变的适应度之和。
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值