2024年11月14日,北京大学现代农业研究院郭立研究员团队的本氏烟草完整基因组研究成果以“The complete genome assembly of Nicotiana benthamiana reveals the genetic and epigenetic landscape of centromeres”为题,在国际著名期刊Nature Plants上在线发表,是国际上首个报道的多倍体植物完整基因组。
文章通过构建本氏烟草端粒到端粒无缺口基因组,对本氏烟草进行了亚基因组分型,进一步确定林烟草(N. sylvestris)和渐狭叶烟草(N. attenuata)最可能是其二倍体祖先物种。研究还深入解析了异源四倍体本氏烟草的着丝粒序列及其表观特征,丰富了我们对本氏烟草基因组进化和着丝粒演化过程的认识。
文章标题:The complete genome assembly of Nicotiana benthamiana reveals the genetic and epigenetic landscape of centromeres
合作单位:北京大学现代农业研究院
发表期刊:Nature Plants
研究对象:本氏烟草
百迈客生物为该研究提供了PacBio HiFi、Hi-C、Illumina和RNA-seq测序服务。
研究背景
本氏烟草(Nicotiana benthamiana)是一年生茄科烟草属植物,原产于澳大利亚北部地区,和用于制作香烟的普通烟草(N. tabaccum)是近缘物种。本氏烟草最为人知的是作为植物学和合成生物学研究的模式植物。本氏烟草凭借其对病毒的易感性和在瞬时基因表达的便利性成为了植物科学家的“宠儿”,同时它也是植物天然产物和疫苗异源合成的重要底盘生物。因此,解析本氏烟草的基因组密码对促进植物科学研究和生物制药产业具有重要的价值。本氏烟草是异源四倍体,由两个二倍体祖先在距今500万年-600万年杂交形成,之后基因组演化形成现今的19对染色体。本氏烟草基因组约为2.85Gb,其草图最早发表于2012年,之后的12年间多个改进版本的本氏烟草基因组陆续公布,组装质量有了很大提升,但仍然存在多个缺口与组装注释错误,严重影响了对这一模式生物的功能基因组学的研究进程。
着丝粒是负责细胞分裂过程中染色体平均分配给子细胞的基因组关键区域,也被称为基因组的暗物质区域。因其高度复杂并富含重复序列,着丝粒的序列很难被测序和破译。近年来随着测序技术和生物信息算法的快速发展,包括人类、拟南芥、酵母在内的多个模式生物以及玉米、水稻、辣椒、生菜等作物的着丝粒特征逐渐被揭示。这丰富了我们对这些基因组暗物质的认知,为疾病研究和治疗、作物单倍体育种、人工染色体合成等前沿科学提供理论指导。然而,我们对生物界着丝粒的结构和进化理解仍然处在初期,绝大多数生物的着丝粒区域仍未解析。此外,多倍体生物例如四倍体本氏烟草、四倍体马铃薯、六倍体小麦等,基因组经历了复制、重排和结构变异等事件,在此过程中着丝粒如何演化和维持功能也有待阐明。异源四倍体的本氏烟草为这些问题的解答提供了一个理想的模型。
研究结果
研究团队首先采用最新的单分子测序技术(HiFi,116.7x + ONT ultra-long,47.9x),Hi-C(150x)和Bionano(329.6x)光学图谱等多种技术相结合策略,构建了首个T2T无缺口的本氏烟草基因组(2.85 Gb),实现所有染色体的完整分型组装(图1),并鉴定到所有19个着丝粒和38个端粒,contig N50值达到146.4 Mb。随后的质量评估表明该基因组具有很高的碱基准确性和组装完整性。
研究团队还进一步基于着丝粒特异结合蛋白CENH3的ChIP-seq数据,确定了本氏烟草基因组的完整着丝粒序列,并揭示了其着丝粒全景特征。令人惊讶的是,与辣椒和马铃薯等茄科作物的着丝粒(以LTR/Gypsy反转录转座子为主)不同,本氏烟草着丝粒不仅有Gypsy序列,而且存在大量的卫星(Satellite)DNA的重复阵列,暗示这些着丝粒特异的卫星重复序列是在本氏烟草中新出现的(图2)。经过仔细分析,研究团队证明了本氏烟草着丝粒卫星阵列可能起源于核糖体DNA的基因间间隔序列。
此外,在着丝粒组蛋白CENH3优先占据的区域,Gypsy反转录转座子和核基因组线粒体插入序列(NUMT)广泛侵入本氏烟草着丝粒,表明这些DNA元件在着丝粒功能中起着至关重要的作用。有趣的是,NUMT在本氏烟草着丝粒中的插入具有很强的亚基因组偏好性,并且主要与母体着丝粒周围有关。亚基因组分析表明,卫星阵列的出现可能推动了多倍体后着丝粒的形成(图2)。
最后,该研究提出一个模型来解释本氏烟草着丝粒的进化,即本氏烟草基因组在多倍化后通过新着丝粒形成、卫星序列扩展、反转录转座子的富集和NUMT整合而实现着丝粒进化(图1),丰富了我们对于茄科植物和多倍体植物着丝粒演化的认知。
研究总结
该研究公布了模式植物本氏烟草的T2T无缺口基因组,并揭示了其着丝粒的全景结构及其表观遗传特征,作为国际上首个报道的完整分型多倍体植物基因组,该研究成果具有里程碑意义。本氏烟草完整基因组的破译不但为植物科学研究提供了重要的遗传资源,也将促进本氏烟草作为模式和底盘植物在生物技术领域的广泛应用。
内容来源于北京大学现代农业研究院,侵删