合作文章|石榴基因组大揭秘:关键位点如何改写耐寒历史与种群格局?

图片

发表期刊:Horticulture Research

影响因子:7.6

团队:河南农业大学生命科学学院姚文教授、北京科技大学张娟教授、新疆农业科学院园艺作物研究所马凯研究员为本文共同通讯作者。河南大学农学院骆翔博士、河南农业大学硕士生耍震阳为本文共同第一作者。

研究背景

石榴原产中亚,是具有重要经济价值的果树,其果实营养丰富,在全球广泛种植。软籽石榴因品质优良,深受消费者喜爱,市场前景广阔。然而,冷害严重制约了软籽石榴的种植,几乎所有一年生软籽品种都极易受冷害影响,这成为石榴产业发展的重大阻碍,因此,明确石榴耐寒性的遗传机制至关重要。

虽然高通量测序技术的发展推动了石榴基因组研究,已有多个石榴品种的基因组完成组装,也识别出一些与重要性状相关的遗传变异,但目前对石榴耐寒性遗传基础的了解仍不全面。一方面,缺乏高质量的硬籽石榴参考基因组,限制了对基因组变异的全面分析;另一方面,对石榴群体内大规模结构变异的研究不足,难以确定与耐寒性相关的功能基因。所以,深入开展石榴基因组研究,挖掘耐寒关键基因,对石榴产业的发展十分关键。

技术路线

图片

研究结论

1、“三白” 高质量的从头基因组组装

本研究通过整合PacBio、Hi-C和Illumina测序技术,完成了抗寒硬籽石榴品种“三白”的基因组组装。作者先利用180X左右的 PacBio 测序数据(56.08Gb)进行初始的 contig 组装,得到 283 个 contig。使用 Illumina 双端读数对这些 contig 进行校正和优化,得到了包含 283 个 contig、contig 的 N50 为 15.93Mb、总长度为 318.59Mb 的组装结果。该大小与最近公布的‘突尼斯’基因组(320.31Mb)相近。利用 32.68Gb 的 Hi - C 数据(105 X)将 283 个 contig 挂载到 8 条染色体(2n = 16)上,约 92.89% 的序列成功挂载到 8 条染色体上。基因组的总体 GC 含量计算为 40.48%,与‘突尼斯’(40.38%)相当。随后对组装的完整性进行评估,BUSCO 值为97.18% 。为了进一步评估‘三白’组装的连续性,作者计算了 LTR 组装指数(LAI),该指数用于评估 LTR 反转录转座子的完整性。‘三白’基因组的平均 LAI 得分为 16.42,与‘突尼斯’基因组(17.94)相当。此外,作者还揭示了‘三白’和‘突尼斯’基因组组装之间存在显著的共线性。这些结果共同表明了‘三白’基因组组装质量较高。

图片

图1“三白” 的代表性表型和基因组特征

2、“三白” 基因组中转座子和蛋白质编码基因的注释

使用 RepeatMasker 和 Repbase 重复序列库(v15.02),在‘三白’基因组中总共鉴定出 366,987 个转座元件(TEs)。这些 TEs 的总跨度为 141.13Mb,占基因组的 45.40%。通过从头预测、基于同源性的蛋白质比对、RNA - seq 数据比对和 PacBio IsoSeq 转录本比对进行蛋白质编码基因的注释。在‘三白’基因组中总共注释了 32,319 个蛋白质编码基因,这与在‘突尼斯’基因组中注释的 33,594 个蛋白质编码基因相当。此外,使用各种数据库对 98.11% 的基因进行了功能注释,包括 KOG(43.44%)、KEGG(29.20%)、NCBI NR(97.22%)、Swiss - Prot(63.83%)和GO(70.29%)。

图片

3、“三白” 与 “突尼斯” 之间结构变异的鉴定

通过将‘突尼斯’的基因组组装与‘三白’基因组进行比对,发现在两个基因组的共线性区域内有 26,711 对同源基因。此外,还鉴定出 5892 个‘三白’特有的基因和 6651 个‘突尼斯’特有的基因。随后作者分析了‘三白’和‘突尼斯’之间的结构变异,结果显示,两个品种之间总共存在 28,607 个非冗余结构变异,平均序列长度为 4.45kb,最大长度可达 5Mb。值得注意的是,这些结构变异中约 5%(1441 个)是长度超过 1kb 的大变异,2 号染色体上的结构变异数量最多。

已鉴定的 28,607 个结构变异包括 11,043 个缺失(DELs)、650 个重复(DUPs)、16,197 个插入(INSs)、117 个倒位(INVs)、205 个拷贝数变异(CNVs)和 395 个易位(TRAs)。其中,6593 个 DELs、DUPs 和 INVs 是通过基因组比较鉴定到的,而 8902 个 DELs、DUPs 和 INVs 是通过 SMRT 读数比对鉴定出来的。通过基因组比较鉴定到的 DELs、DUPs 和 INVs 中有 55.9%(3685 个)也得到了 SMRT 读数比对的支持,这表明了结构变异检测方法的可靠性。

图片

图2、“三白” 和 “突尼斯” 基因组比较鉴定出的结构变异(SVs)

4、石榴种质的群体遗传分析

利用长读长重测序数据,以 28,607 个结构变异对 38 份石榴种质进行基因分型,鉴定出 8085 个多态性结构变异(pSVs)。将长读长重测序数据进一步与‘三白’基因组进行比对,得到 6154 个 pSVs。作者总共检测到 14,239 个 pSVs,包括 7127 个 DELs、6204 个 INSs、765 个 TRAs、99 个 DUPs 和 44 个 INVs。基于这些 pSVs 将 38 份种质分为两个不同的亚群,Pop1 和 Pop2,主成分分析(PCA)和系统发育分析进一步支持了这一结果。Pop1 主要由硬籽且耐寒的种质组成,而 Pop2 主要包括更易受冷害的软籽种质。同时,利用短读长测序数据从 38 份石榴种质中鉴定出 428,815 个单核苷酸多态性(SNPs)。基于 SNPs 的 PCA 和结构分析结果与基于 pSVs 的分析结果一致。pSVs 衍生的混合比例(Q 值)与 SNP 数据的 Q 值显著相关,这些发现证实了检测到的结构变异的可靠性,并突出了它们在推动石榴遗传分化中的作用。

使用 SNP 和结构变异数据计算了 Pop1 和 Pop2 的核苷酸多样性(π)、Tajima's D 值和杂合率。两个群体都表现出显著的遗传多样性。Tajima's D 值在基因组中分布不均,平均值超过零。这一结果表明石榴可能经历了历史上的种群数量下降,或者受到了平衡选择的影响。基于 SNP 数据,与 Pop2 相比,Pop1 种质显示出更高比例的杂合变异,这可能表明 Pop1 具有更多样化的基因库。相比之下,Pop2 可能经历了更强烈的选择压力,Pop2 的连锁不平衡(LD)衰减较慢进一步支持了这一观点。这些结果表明 Pop1 和 Pop2 在驯化过程中经历的不同选择压力。Pop1 中更高的遗传多样性和更快的 LD 衰减表明该群体可能对环境变化具有更强的适应性,这可能与增强的耐寒性有关。

图片

图3 基于结构变异(SVs)的 38 个石榴种质群体遗传分析

5、结构变异对石榴 1 号染色体上高分化基因组区域的贡献

此前,作者在‘突尼斯’基因组中鉴定出 1 号染色体上一个异常大的基因组区域导致了群体内的分化,该基因区域跨度约 26.2Mb。在本研究中,作者通过对来自 38 个不同石榴种质的 SNP 和结构变异数据进行选择清除分析,进一步证实了该基因组区域的存在。分析显示,与 1 号染色体上的其他片段相比,该区域的核苷酸多样性(π)和 SNP 数量显著降低。此外,286 份种质的重测序数据与‘三白’基因组的比对显示,在这个大的选择区域内,大多数易受冷害种质中表现出‘三白’参考基因型的 SNP 比例始终低于 20%。相反,对于大多数耐寒种质,这一比例显著高于 80%。这些发现为这个大基因组区域中显著较低的 FST 和核苷酸多样性提供了合理的解释,表明选择有利于耐寒种质中的‘三白’基因型。

为了进一步探索该区域的结构复杂性,作者选择了 12 份具有代表性的种质,包括三份具有‘三白’基因型的耐寒种质、三份具有与‘三白’不同基因型的耐寒种质、三份具有‘三白’基因型的冷害种质和三份具有与‘三白’不同基因型的冷害种质,并将它们的 Illumina 短读数据和 SMRT 长读数据与‘三白’参考基因组进行比对。该分析揭示了一个约 540 万碱基对的倒位,该倒位与之前鉴定的大倒位在很大程度上重叠。值得注意的是,这种倒位仅存在于在大选择区域中基因型与‘三白’显著不同的种质中,这表明这种倒位可能在耐寒性中发挥作用。这些结果表明,1 号染色体上的这个大选择区域可能是由复杂的结构变异(特别是倒位)塑造的,这可能会阻碍耐寒和冷害基因型之间的重组。

图片

图4 石榴 1 号染色体上的一个高度分化的基因组区域

6、结构变异对石榴群体内分化的贡献

为了识别在石榴驯化过程中导致种群分化的潜在基因组变异,作者分别基于结构变异(SVs)和单核苷酸多态性(SNPs),通过滑窗分析计算Pop1(n = 19)和 Pop2(n = 19)之间的分化指数(FST),对每个窗口FST值进行排序,并选取FST值最高的前5%作为候选区间。利用单核苷酸多态性(SNPs)鉴定出 503 个选择清除区域,利用结构变异(SVs)鉴定出 336 个选择清除区域,它们分别约占‘三白’基因组的 7.85% 和 3.77%。在这些候选区间内共注释到 3575 个蛋白质编码基因。值得注意的是,约 69.7%(17.42Mb)基于 SNP 的选择信号与基于 SV 的选择信号重叠(12Mb),这些重叠的基因区间内包含 627 个基因。其中,在 SNP 和 SV 检测到的选择清除区域中均存在2 号染色体上的 MYB 转录因子(Pg02g59220)。相比之下,两个 AP2 转录因子(Pg03g141460、Pg04g177000)、一个 NAC 转录因子(Pg04g163740)和一个 WRKY 转录因子(Pg04g173890)仅在基于 SV 的选择清除区域中被检测到,这突出了 SV 对基因组变异的独特贡献。此外,在基于 SNP 的选择清除区域中鉴定出 8 个基因,包括 3 个 NAC 基因(Pg02g85170、Pg08g293430、Pg01g45590)、2 个 MYB 基因(Pg01g46990、Pg05g201700)、1 个 AP2 基因(Pg01g45790)和 FoxO信号通路上的2个基因(Pg07g259140 和 Pg02g59410)。已知 FoxO通路调控参与氧化应激反应、细胞凋亡和 DNA 修复的基因,这些基因对于植物在极端环境条件下的生存至关重要。这些发现表明,整合 SNP 和 SV 数据对于全面捕捉遗传多样性且更全面地了解石榴群体内的分化具有重要意义。

7、鉴定 PgNAC12 为石榴耐寒性的候选基因

为了揭示石榴耐寒的调控基因,作者分别构建了两个群体,即‘Shandazi’与‘Tunisia’杂交(‘SDZ’בTNS’),以及‘Zhongnonghong’与‘Shandazi’杂交(‘ZNH’בSDZ’)。‘Tunisia’和‘Zhongnonghong’是易受冷害的品种,而‘Shandazi’是对冷胁迫具有高度耐受性的品种。利用‘SDZ’בTNS’的 F₁群体进行混合分组分析法(BSA),成功定位到 41 个与耐寒性相关的候选区间,同样,对‘ZNH’בSDZ’的 F₁群体进行的 BSA 分析也定位到了 37 个与耐寒性相关的基因组候选区域。综合两个群体的分析结果,确定了三个候选区间,分别命名为 Pgcol1_1、Pgcol1_2 和 Pgcol8。在这些区域内,共注释出 24 个蛋白质编码基因。其中,有 12 个基因在硬籽‘Dabenzi’和软籽‘Tunisia’的内种皮中有表达,于开花后 95 天或 140 天存在差异表达。不过,它们的具体作用还需要进一步验证 。

选择性清除分析显示,Pgcol1_1 和 Pgcol1_2 区域中的 24 个基因里有 9 个基因(Pg01g40840、Pg01g40850、Pg01g40860、Pg01g45520、Pg01g45530、Pg01g45560、Pg01g45570、Pg01g45580 和 Pg01g45590)位于本研究检测到的选择性清除区域内。这些基因可能代表了驯化过程中应对冷胁迫的适应性印记。值得注意的是,Pg01g45590 被注释为一个含 NAC 结构域的转录因子(PgNAC12),它在‘三白’的根中表达水平较高。进一步的遗传分析揭示,PgNAC12 外显子中有一个单核苷酸多态性(SNP,Chr1: 50,343,816),该 SNP 可区分‘突尼斯’和‘三白’,可导致‘突尼斯’中的赖氨酸(Lys)被‘三白’中的谷氨酸(Glu)所取代。重要的是,这种替换主要出现在耐寒种质中(Pop2 群体中占 89.47%)。这一发现凸显了 PgNAC12 是石榴耐寒性相关的一个很有潜力的候选基因。

图片

图5 通过BSA分析鉴定调控耐寒性的 PgNAC12 基因

8、PgNAC12 调控 PgCBF1 增强耐寒性的功能验证

为了进一步研究 PgNAC12 的功能,作者克隆了 PgNAC12 的编码序列(CDS),并在花椰菜花叶病毒 35S 启动子(CaMV35S)的控制下,在拟南芥中过表达该基因。在冷胁迫下,这些过表达植株与野生型(WT)对照相比,表现出显著更强的耐受性。先前的研究表明,NAC 转录因子在多种植物物种中,通过 CBF - COR 信号通路在冷胁迫响应中发挥关键作用。表达分析显示,PgCBF1(Pg01g43100)在石榴的根中高度表达,与 PgNAC12 类似。受这一发现的启发,作者进一步克隆了 PgCBF1 的 CDS 序列,并在 CaMV35S 启动子的控制下,在拟南芥中过表达该基因。结果显示,过表达株系生长健壮,而野生型植株的叶子则变黄枯萎。这些结果表明,过表达 PgCBF1 显著增强了拟南芥的抗寒性。

为了更深入探究 PgNAC12 和 PgCBF1 在植物冷胁迫耐受性中的作用,作者通过酵母单杂交(Y1H)试验验证了 PgNAC12 与 PgCBF1 启动子之间的相互作用。酵母单杂交试验表明,PgNAC12 可直接与 PgCBF1 的启动子结合。为了进一步量化 PgNAC12 与 PgCBF1 启动子的结合能力,采用了双报告质粒系统进行瞬时双荧光素酶检测。结果显示,在室温下,PgNAC12 对 PgCBF1 启动子具有显著的激活作用,且在冷处理条件下这种激活作用进一步增强。这些发现有力地证实了 PgCBF1 是 PgNAC12 的直接作用靶点,意味着 PgNAC12 能够通过直接结合 PgCBF1 的启动子来调控其表达。此外,冷处理会增强 PgNAC12 与 PgCBF1 启动子的结合能力,这表明存在一个正反馈回路,放大了植物对冷胁迫的响应。总体而言,这些研究结果突出了 PgNAC12 和 PgCBF1 在区分软籽和硬籽石榴适应冷胁迫方面的关键作用。这些基因的差异表达可能解释了不同石榴品种间耐寒性的差异,为增强抗寒性的育种计划提供了宝贵的见解。

图片

图6 PgNAC12 和 PgCBF1 调控耐寒性的功能验证

研究结论

文章通过整合多种测序技术,成功组装了‘三白’石榴高质量染色体水平参考基因组,其 contig N50 达 15.93Mb ,为石榴基因组学研究提供了重要参考。对 38 个石榴种质进行分析,鉴定出 14,239 个多态性结构变异(pSVs),发现这些 pSVs 在种群分化中起重要作用,且与耐寒性相关。利用混合分离分析(BSA)等方法,确定了 3 个与耐寒性相关的候选基因组区域和 24 个候选基因,其中 PgNAC12 是关键候选基因。进一步研究发现,PgNAC12 可通过直接结合 PgCBF1 的启动子,正向调控其表达,从而增强植物的耐寒性。本研究为石榴耐寒性的遗传机制提供了新见解,也为软籽石榴品种的遗传改良提供了有价值的资源。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值