综述:难以获得充足理论支持的软清扫(soft sweep)

本文摘自文章:On the unfounded enthusiasm for soft selective sweeps(Jensen, J. Nat Commun 5, 5281 (2014). https://doi.org/10.1038/ncomms6281)



核心观点

  1. 稀有常态突变固定后大概率会留下硬清扫的群体遗传图谱。
  2. 常态突变需要有较高的频率,才能在固定时有多种单倍型,呈现出软清扫图谱。
  3. 中频常态弱有益突变可能留下软清扫图谱。
  4. 群体中有限量的中频常态弱有害突变可能只能留下少量的软清扫图谱。
  5. 强有益突变有利与物种快速适应新环境,出现在许多平行演化的案例中。但这种方式难以创造新的功能蛋白,物种可能需要通过大量弱有益、弱有害突变的缓慢积累来进行功能上的创新。
  6. 表型涉及到的基因越多,或者基因有更多的副本,则相关区间长度的增加使其越容易积累与表型相关的突变。同时,重组的存在会产生更有益、更有害的组合,加速有益基因的扩张和有害基因的淘汰,促进物种的演化。
  7. 重组还会担任类似 “缓冲液” 的角色,使群体可以容纳更多的有益、有害突变,提高遗传多样性。
  8. 目前清扫区的检测中也存在着很多的不足,存在较大的假阳性与假阴性。



名词解释


  1. 硬清扫(hard sweep):一个新的有益突变 出现在群体中,并且 频率迅速上升到固定 (a single novel beneficial mutation arises in a population and rises in frequency quickly to fixation)的过程(图 1a)。
  2. 软清扫(soft sweep):不满足硬清扫的其他突变演化过程的统称(图 1b、c)。软清扫概念流行的部分原因是,目前在自然种群中发现的符合硬清扫过程的 DNA 区间很少。
  3. 常态突变(standing variants):产生在 选择前基本不受选择压力作用 的突变。突变一产生便受到选择作用的划归为新突变类。
  4. 有效中性突变(effectively neutral mutation):频率变化与中性突变类似,主要取决于遗传漂变的突变。有效中性突变可以是中性的、弱弱有害、弱弱有益的。
  5. 突变选择平衡(mutation–selection balance):群体中有害等位基因数量的平衡,当突变产生有害等位基因的速度等于通过选择消除有害等位基因的速度时,就会出现这种平衡。



在这里插入图片描述


稀有常态突变


Orr 和 Betancourt(2001)讨论并计算了:稀有常态突变在有多种单倍型的情况下,固定时突变仍有多种单倍型的概率。他们推导出当 4 N u × s b / s d > 1 4Nu×s_b/s_d>1 4Nu×sb/sd>1 时( N u Nu Nu 是群体突变率, s d s_d sd 是环境变化前突变所受的选择压力, s b s_b sb 是环境变化后突变所受的选择压力),固定时突变有多种单倍型的概率大于 50% 。其中 群体大小 N N N 的增加 和 选择发生前选择压力 s d s_d sd 的降低,使群体中可以保留更多的突变拷贝;而 选择时突变适应性 s b s_b sb 的提高,使突变可以更快的被固定,降低了因随机遗传漂变而消失的概率。如在 N = 1 × 1 0 4 , s d = 0.05 , s b = 0.01 , u = 1 0 − 5 , h = 0.2 N=1 × 10^4, s_d=0.05, s_b=0.01, u=10^{−5}, h=0.2 N=1×104,sd=0.05,sb=0.01,u=105,h=0.2 条件下,突变选择平衡时群体中会有 20 个拷贝,在固定时有 96% 的概率是只有一种拷贝最后被固定,其他拷贝都因随机漂变而消失了;若 N = 1.5 × 1 0 5 N=1.5×10^5 N=1.5×105 ,突变选择平衡时群体中有 300 拷贝,在固定时有 50% 的概率是只有一种拷贝最后被固定。

单一单倍型固定的含义是指多个拷贝中只有 1 个拷贝在选择过程中幸存了下来,其他拷贝都因随机漂变而消失了。Orr 和 Betancourt 的结论也可以理解为:当 4 N u × s b / s d > 1 4Nu×s_b/s_d>1 4Nu×sb/sd>1 时,有至少 2 个拷贝幸存下来的概率高于 1 个拷贝, P r ( x ≥ 2 ∣ x > 0 ) > P r ( x = 1 ∣ x > 0 ) Pr(x\ge2|x>0)>Pr(x=1|x>0) Pr(x2x>0)>Pr(x=1x>0)。其中 x x x 为固定时被选择突变的拷贝数, x > 0 x>0 x>0 表示突变没有在选择过程中丢失。

N u × s b / s d Nu×s_b/s_d Nu×sb/sd 公式中可以看出,在自然突变率不变的情况下,固定时多拷贝的概率与 N , s b , s d N, s_b, s_d N,sb,sd 相关。下图绘制了不同参数区间下多拷贝固定概率高于单拷贝的情况。可以发现,随着群体大小 N e N_e Ne 的增加,对选择压力的要求不断放松,选择前可以更有害,选择后可以更中性,固定过程的时间可以更长。



在这里插入图片描述


由于单拷贝和新突变一样,都是从 1 逐渐到固定的,所以两者固定后的群体遗传图谱没有差别,都是硬清扫图谱,单倍型种类少且遗传多样性低。例如:棘背鱼中的 Eda 基因位点(研究:由 Eda 基因的重复固定而导致的棘鱼(Sticklebacks)平行演化)。先前的研究证明棘背鱼的淡水种群是从海洋种群演化过来的,其中淡水种群的骨甲相比海洋群体更薄。Colosimo, P. F(2005,Science)测定了 2 个海洋群体的调控骨甲厚度的等位基因的频率,其中薄骨甲等位基因的频率分别为 0.2% 和 3.8%。但通过淡水群体遗传图谱很难推断薄骨甲基因是继承自海洋群体,还是淡水群体的新突变(然后突变迁移至海洋群体中,在负选择压力下,频率维持在较低的水平)。

只有当多个拷贝被固定下来,并且多个拷贝由不同的单倍型构成时,才有可能固定后呈现出软清扫图谱。所以 Orr 和 Betancourt(2001)认为:常态突变需要有较高的频率,才能在固定时有多种单倍型,呈现出软清扫图谱。

综上,本文作者认为,稀有常态突变固定后大概率会留下硬清扫的群体遗传图谱



中频常态突变

上一节 Orr 和 Betancourt 通过公式推导,认为中频常态突变可以留下软清扫图谱。但作者认为这种考量仅讨论了单个中频常态突变在群体中的演化,而没有考虑大量中频常态突变给群体适应性带来的负担。本节作者主要论述内容为:中频常态突变在物种中存在的成本

  1. 在荧光假单胞菌的抗生素实验中(Kassen and Bataillon,Nat. Genet,2006,实验:实验选择下细菌有益突变的分布特征),有 95% 的抗性突变在正常情况下是有害的,会降低细菌的适应度。
  2. Linnen, C. R(Science,2009)研究 Peromyscus 鼠的适应性中发现,其毛色的进化是发生在环境变化后的。

两个方向的实验使作者认为:

  1. 潜在有益突变在选择发生前大概率是有害的,即潜在有益突变是有成本的,所以无法积累过多的潜在有益突变;
  2. 物种有能力在环境变化后利用新突变来适应新环境;
  3. 相比之下,以潜在有益突变作为应对环境变化的 “保险” 并不 “划算”。如果群体中存在较多的由中频常态突变固定留下的软清扫图谱,那么说明群体在大多数环境变换后都有对应的中频常态突变受选择,即群体中储存了较多的中频有害突变作为 “保险”,这对群体的生存是不利的。而有限量的中频常态突变所能应对的情况肯定十分有限,即大多数环境变化不能依靠储存在群体中的中频常态突变来应对,此类突变在物种演化中的占比可能较少。

所以作者认为 群体中有限量的中频常态弱有害突变可能只能留下少量的软清扫图谱。但如果是有益突变,则不用担心增加群体的 “负担”。在 Kassen and Bataillon 的实验中虽然有益突变少,但也是存在的 —— 中频常态弱有益突变可能留下软清扫图谱



有益突变间的竞争

前面有关常态突变的讨论的都是 单个有益突变 的群体遗传图谱(图 1b)。如果选择中有多个有益突变参与,则涉及竞争问题。如果多个有益突变在竞争中达到平衡,可能会留下软清扫的群体遗传图谱(图 1c)。因为有益突变是依次出现的,不存在绝对的同时出现,所以首先考虑的问题是 有益突变的积累

这里的突变积累是指 一次演化中的突变积累,即突变尚未固定前再积累一个突变。如果突变固定后再积累一个新突变,视为两次连续演化,而非突变积累。


突变积累有两种形式:

  1. 多次突变发生在同一单倍型上;
  2. 多个位点的突变因重组而组合在一个单倍型上。

多次突变发生在同一单倍型上

由于自然突变率很低,除非群体足够大,否则多次突变发生在同一单倍型上的概率很低。另一方面,目前对 突变适应度分布(distribution of fitness effects,DFE)的研究显示突变大概率是弱有害、有害的,小概率是有益的。Pennings and Hermisson(2006,Mol. Biol. Evol.)计算推导了在不考虑重组情况下,积累两个有益突变并形成软扫描图谱的概率 > 50% 所需的 群体突变率 μ b > 0.04 μ_b>0.04 μb>0.04,其中 b b b 指第二个有益突变。庞大的群体数量 既提高了多次有益突变出现的概率,也降低了突变因遗传漂移而丢失的概率。

综上,有益突变的积累需要庞大的群体数量作为支撑,否则 多次有益突变发生在同一单倍型上的概率极低 ;同时,在第二个有益突变发生之前,单倍体可能 会先积累一定量的弱有害突变


虽然有益突变积累困难,但并不是不可能。生物可以通过 增加繁殖代数增加受精卵到配子之间的复制代数 等方法来不断积累突变,弥补群体数量不足的问题。物种通过有益突变的积累来演化可以分为两种模式:1. 大量弱有益突变缓慢 积累;2. 少数强有益突变快速 积累。关于生物对两种模式的选择,作者从 平行演化(parallel evolution)角度来进行讨论。以下是几个已经发现的平行演化案例:

  1. 由 Eda 基因的重复固定而使不同地域的棘鱼适应本地淡水环境;
  2. 多种以包含有毒物质 cardenolide 的植物为食的昆虫物种中,ATPα 亚基出现相同位点突变;
  3. Mc1r 和 Aguoti 基因区域的特定突变是不同地域小鼠毛色适应当地环境的共同原因;

这几个案例都表现出少数强有益突变快速的模式是因为案例都涉及到:新自然环境要么对物种有极大的选择压力(抗生素),要么有极大的吸引力(大量食物)。极大的选择压力要求群体必须在几代内出现适应性突变,这限制了个体内可以积累的有益突变总量,物种在两种模式并行的情况下,最后只有第二种模式成功的个体才能在选择中幸存下来。而极大的吸引力会使最先获得适应性突变的个体享受大量的资源并繁殖出大量后代,所以同样是第二种模式成功的个体才能在新环境中建立优势。因为物种必须 快速适应新环境,所以选择保留下来的也都是携带 少数强有益突变 的个体。又因为少数突变 限制了突变可能的组合数,使自然选择只能在这少量的组合中进行选择,所以导致了 突变相似 。综上,少数强有益突变快速积累在留下了 硬清扫 图谱。

值得注意的是,少数强有益突变快速积累模式成功是有前提的:对 已有基因单位点替换较明显的提高 生物体对环境的适应力。所以,如果 不存在适合的基础基因,或需要 替换多个位点,或表型需要的是 微调,较大幅度的调整反而会降低个体适应力,或需要 创造新的功能蛋白,那么物种则需要依靠 大量弱有益突变的缓慢积累来逐渐适应环境

可惜的是 “大量弱有益突变缓慢积累” 观点目前仍没有相关证据证明,原因可能是:弱有益使基因难以通过表型差异而定位挖掘出来。所以作者认为:在没有证据充分支持的情况下,难以判断大量弱有益突变缓慢积累与软清扫图谱之间的关系



多个位点的突变因重组而组合在一个单倍型上

如果有益突变发生在不同单倍型的不同位点上,则需要考虑 重组 对有益突变间竞争的影响。

一般认为,如果选择区间存在较高的重组率,那么不同有益突变位点可以通过重组而组合在一个单倍型上,形成优势单倍型,留下硬扫描图谱。如果重组率较低,效应相似的不同突变之间可能达到平衡,使群体形成软清扫图谱;若不同突变之间效应相差较大,则较强的优势突变会占据较多的频率,留下硬扫描图谱。

由于目前发现的案例中,功能突变主要集中在较窄的区间内,基因内不同位点的突变之间难以通过重组进行整合,此时不考虑重组影响,可归属于前文 常态突变 的讨论。可以看出,在个体数量有限的情况下,如果 调控表型的机制越复杂涉及到的基因越多,或者基因有更多的副本等,因为相关区间长度的增加,群体越容易积累突变;如果这些区间在染色体上分布比较分散,则 容易通过重组产生更有益、更有害的组合,加速有益基因的扩张和有害基因的淘汰,促进物种的演化



个体适应性与重组

前面讨论的内容集中于片段(突变)在群体中的演化过程,但实际的演化是以个体的染色体为基本单位,而非片段。尽管重组可以使片段脱离特定的染色体背景,但是其频率的改变依旧依赖于所处的染色体背景。个体在环境中的适应性依赖于染色体上所有突变的效应和,而非单个突变 。对于非关键突变,突变的产生只是让个体适应性出现小的波动。所以发生在适应性弱的个体上的有益突变,会大概率被淘汰;反之,发生在适应性强的个体上的有害突变,会大概率被保留。


下面讨论染色体间重组通过个体适应性对突变演化的影响:

  1. 重组可以让染色体之间彼此交换零部件,自己产生的零部件不一定适合自己,但是可能十分适合别人。在自然突变率低,突变总量少的情况下,重组使每个突变得到更充分的利用,促进突变间最优组合模式的挖掘
  2. 集中了更多有害突变的染色体的频率会在群体中不断降低,重组时交换到自己片段(有害片段)的概率不断降低,得到其他人片段(有益片段)的概率不断升高。所以重组在群体中担任了 “缓冲液” 的角色:让有益突变交换到有害集合中,有害突变交换到有益集合中;既降低了有害突变被淘汰的概率,也降低了有益突变完全固定的概率,使有害突变能够以低频的形式存在与群体中 。同时,防止偶然出现的极有益突变组合快速固定而导致 其他区域的遗传多样性降低 。如果没有重组,整个染色体都会伴随着一组突变的固定而固定,多样性大幅降低的同时,也会失去其他有益突变。重组类似化学中的缓冲液,PH 高了降一些,PH 低了升高一些,使群体可以 容纳更多的有益、有害突变,提高遗传多样性



检测方法的有效性

上面内容主要讨论了硬、软清扫图谱存在的理论支持,但是 在实际的检测中也存在着很多问题。比如不同研究人员对人类基因组清扫区的判断上就存在较大差异:1. 不同研究间清扫区间数量差异较大;2. 不同研究找到的清扫基因集合之间重合度很小。导致上述问题的原因,既包括检测方法的不同,也包括样本数据集间的差异。

作者这里引用了 Crisci, J 的研究(2013,Front. Genet.):使用 Sweepfinder、SweeD 和 OmegaPlus 三款常用来挖掘选择清扫区的软件来识别模拟出的软、硬清扫区。结果如下图所示,其中实现为平衡群体中的模拟,虚线为中等瓶颈群体的模拟(数量减少至原先的 10%)。从研究结果来看,识别清扫区的有效性不太理想,可能有大量的清扫区间被遗漏,而发现的区间也包含许多假阳性。

在这里插入图片描述


  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值