野生二粒小麦基因组在science发布
现代小麦是世界上的三大粮食作物之一,由于其基因组和复杂,它的基因组研究远远落后于水稻和玉米,迄今还没有一个较好的参考基因组发布。不过随着测序成本和技术的进步,今后一段时间小麦及其祖先种的基因组会陆续发布。我们餐桌上的小麦是一个异源六倍体物种,经历一系列的驯化才变成今天的小麦。研究已经表明六倍体小麦是由3个2倍体祖先种间2次种间杂交而来。第一次杂交形成异源四倍体野生二粒小麦,也即今天的主角。野生二粒小麦基因组的解读具有重要意义,不仅可以让我们更清楚的了解小麦的进化史,更重要的还可以发掘优异等位基因引入到小麦中。
首先介绍下基因组组装中的各项指标如何。这个版本的组装没有利用PacBio序列,不能很好的跨越高度重复区域以及高GC含量区域,所以其基因组连续性仍然很不完美。其contig N50仅仅只有 57.378Kb, scaffold N50达到6.95Mb.
然后利用遗传数据和Hi-C技术将这些scaffold组装至染色体水平。共组装出10.5Gb的序列,包括14条染色体以及不能放置至染色体的scaffold序列。接下来就是利用RNA_seq数据注释基因,共得到65012个高可信的基因。并且98.4%的BUSCO基因被注释出来,这说明基因组还是比较完整的。
这些基因在染色体上的分布大体上两头多,中间少。14条染色体上的62813个基因中,大约有30.4%的基因在20个小麦不同发育阶段的组织中表达,48%的基因至少在其中一个或几个发育阶段表达,21.6%的基因表达水平很低或者没有检测到表达。