2021年3月18日,由河南农业大学王道文研究员团队联合多个单位共同破译黑麦基因组。相关研究成果“A high-quality genome assembly highlights rye genomic characteristics and agronomically important genes”见刊于国际知名期刊Nature Genetics。河南农业大学李广伟博士、王立建博士、靳怀冰博士,北京大学现代农业研究院何航研究员,四川农业大学任天恒副教授以及百迈客生物科技有限公司李绪明作为共同一作共同参与本项研究。河南农业大学杨青华教授、杨建平研究员,中国科学院遗传与发育生物学研究所张坤普副研究员以及河南农业大学王道文研究员为并列通讯作者。
此次论文的发表引起了学术界和媒体界的高度关注,百迈客作为合作参与方及测序技术服务企业,为促进科研成果更广泛更科学的传播,本次特邀请到国内外两篇论文团队一起解析黑麦基因组的奥秘。欢迎各位专家学者报名参加本次国际交流会,会议定于北京时间2021年3月24日(周三)下午15:45—18:00,详细会议流程请点击:黑麦基因组学研究成果《Nature Genetics》见刊国际交流会。

(或点击二维码直接报名)

 

PART ONE

论文内容详解

研究背景
黑麦(Secale cereale, 2n = 2x = 14, RR)属于禾本科小麦族黑麦属,虽然与普通小麦(Triticum aestivum,Ta;2n=6x=42;AABBDD)和大麦(Hordeum vulgare,Hv)有亲缘关系,但黑麦具有独特的农艺性状和基因组特性。黑麦1RS染色体臂携带的抗病基因通过远缘杂交转入小麦基因组,为小麦生产中白粉病和条锈病的防治做出了巨大贡献。此外,黑麦也可以与普通小麦远缘杂交,染色体加倍后,人工合成八倍体小黑麦,具有比黑麦更高的生物量和产量。因此,黑麦是许多国家重要的粮食和饲料作物,也是全球小麦和小黑麦改良的重要遗传资源。

威宁黑麦是我国的栽培黑麦早抽穗优良品种,具有抗白粉病和条锈病的能力。为了解析黑麦优良性状的遗传和分子基础,促进黑麦及相关作物的基因组和育种研究,作者对威宁黑麦进行了基因组测序和分析。

 
材料与方法
基因组:
材料:威宁黑麦自交系,自交18代;荧光原位杂交(FISH)确认基因组染色体对=7组;
测序:270 bp小片段文库(430Gb, ~54X),Illumina 平台;20 Kb大片段文库(497Gb,~63X),Pacbio平台;Hi-C 文库(560 Gb, ~71X),Illumina平台;光学图谱(779.55 Gb,~99X),Bionano Irys平台;
基因注释转录组测序:正常或胁迫(冷或干旱)条件下栽培的植物中的叶、茎、根和穗样品,以及在开花10、20、30、40天后收获的发育中的样品, 采用Illumina及Pacbio平台进行RNA-seq及Iso-Seq;
遗传图谱QTL: 295份威宁黑麦×荆州黑麦杂交的F2代样品,采用SLAF-seq进行标记开发;
抽穗基因表达:威宁黑麦和荆州黑麦样品,播种后4、7和10天采集叶片样品,每个时间点使用3个生物重复,使用Illumina平台进行测序;
选择进化分析:已发表的101份家养黑麦和野生黑麦品种材料的公共数据,包括81份S. cereala、5份S. vavilovii、11份S. strictum和4份S. sylvestre
 
研究内容
  1. 基因组装与注释
  2. 转座子分析
  3. 黑麦基因组进化和染色体共线性研究
  4. 基因重复及其对淀粉生物合成基因的影响分析
  5. 黑麦种子贮藏蛋白(SSP)基因位点的解析
  6. 转录因子(TF)及抗病基因的注释和分析
  7. 早抽穗性状相关基因表达特征的研究
  8. 黑麦驯化过程中染色体区域和基因座的挖掘
主要研究结果
1. 基因组装与注释

流式预估黑麦基因组大小约为7.86 Gb,结合PacBio、Illumina、Hi-C、遗传图谱、BioNano光学图谱等技术进行基因组组装。最终组装7.74 Gb基因组(为预估基因组大小的98.47%),scaffold N50 为1.04 Gb,并将93.67%的序列挂载至7条染色体上(图1)。黑麦中每条染色体基因组大小均在1G左右(2R、3R、4R、6R、7R(~1Gb);1R(0.94097 Gb)、5R(0.99891 Gb) ),比乌拉尔图小麦(T. urartu;Tu;AA型)、节节麦(Aegilops tauschii;Aet;DD型)、野生二粒小麦(T. turgidum ssp. dicoccoides;WEW;AABB型)、普通小麦(Ta)和大麦(Hv)等复杂的麦类中的单条染色体基因组均要大。超大的基因组及染色体,对黑麦基因组组装,特别是染色体挂载带来了巨大的挑战。

将组装结果与两个冬季黑麦品种(Lo7和Lo225)构建的染色体连锁图相比,威宁黑麦1R至7R物理图具有较高的一致性。在先前报道的Lo7的pyro-sequencing reads中97.45%可以定位到威宁基因组,平均序列同源性为97.71%,平均序列覆盖率为97.27%。LAI值为18.42,远高于先前发表的小麦和大麦基因组的LAI值。BUSCO评估结果为96.74%。并注释了86,991个蛋白编码基因。尽管黑麦基因组非常复杂,通过以上评估结果说明,本次研究构建了一个高质量的威宁黑麦基因组。

图1 黑麦基因组特征

2. 转座子分析

威宁黑麦基因组中90.31%被注释为转座子(TE),共包含537个家族的2,671,941个成员,这些TE的含量明显比普通小麦 (84.70%), 乌拉尔图小麦 (81.42%), 节节麦 (84.40%), 野生二粒小麦 (82.20%)以及大麦 (80.80%)更高。其中长末端重复反转录转座子(LTR-RTs)是主要的转座子,在注释的TEs中占 84.49%。

与乌拉尔图小麦、节节麦及大麦的LTR-RTs进行比较发现:(1)Gypsy是威宁黑麦基因组扩张的主要原因之一(Fig. 2a),并且有3个LTR-RT家族(Daniela, Sumaya, Sumana)在威宁黑麦中特异扩张,其中Daniela的占比最高 (Fig. 2b)。(2)威宁黑麦中完整的LTR-RTs插入时间存在独特的双峰分布(Fig. 2c),最近一个扩增峰出现在50万年前,另出现在1.7 百万年(MYA)左右(与大麦相同) (Fig. 2c)。(3)这种双峰分布模式由Gypsy RTs的扩增主导(Fig. 2d)。

图2 黑麦中转座子分析

3. 黑麦基因组进化和染色体共线性研究

通过比较威宁黑麦、乌拉尔图小麦、节节麦、普通小麦(亚基因组TaA、TaB和TaD)、大麦、水稻Os(Oryza sativa ssp. japonica)、二穗短柄草Bd(Brachypodium distachyon)、玉米Zm(Zea mays)、高粱Sb(Sorghum bicolor)、谷子Si(Setaria italica)基因组,共找到2517个单拷贝同源基因。通过对单拷贝基因组构建进化树和计算分化时间发现,在大麦和小麦分化后(15MYA)黑麦和二倍体小麦发生了分化(9.6 MYA) (Fig. 3a)。

作者以水稻为祖先参考基因组,研究了威宁黑麦的染色体进化。威宁黑麦与水稻共鉴定出23个大的共线性区,包含10949对同源基因,可推断出祖先染色体片段在1R到7R之间的排列(图3b):(1)3R来源于一条古老的染色体AGK1/Os1,该染色体的一段易位到6RL;(2)1R和2R分别由两条祖先染色体组成,1R与AGK10/Os10嵌套插入AGK5/Os5有关,2R与AGK7/Os7嵌套插入AGK4/Os4有关;(3)4R, 5R, 6R,7R是通过复杂易位从至少三条祖先染色体上获得的(图3b)。

在威宁黑麦基因组与普通小麦3个亚基因组的比较中,1R、2R和3R分别与小麦1、2和3组染色体完全共线。在4R中发现与4A/4B/4D、7A/7B/7D或6A/6B/6D部分共线性的三个区域。5R与5A完全共线,与5B、5D部分共线是由于易位的4B或4D片段在5BL或5DL的长臂融合(图3c)。在6R中,观察到3个区域与6A/6B/6D、3A/3B/3D或7A/7B/7D部分共线。这些数据将有助于黑麦在禾本科比较基因组学研究以及黑麦与普通小麦杂交研究中的应用。

图3 黑麦基因组进化及染色体共线性分析

4. 基因重复及其对淀粉生物合成基因的影响分析

作者在威宁黑麦中检测到4217个单拷贝基因、23753个分散重复基因 (DDGs)、6659个近端重复基因 (PDGs)、7077个串联重复基因(TDGs)和1866个片段重复基因。转座重复基因(TrDGs)由TE活性诱导的,它们是DDGs的主要组成部分。作者以大麦为参考,在威宁黑麦中鉴定出10357个TrDG,远远大于以相同方式计算的乌拉尔图小麦(7145)和节节麦(7351)中TrDG的数量(图4b)。威宁黑麦所特有的TrDG(5926)也比乌拉尔图小麦(3513)和节节麦(3327)所特有的TrDG更多(图4b)。

接下来作者研究了黑麦淀粉生物合成相关基因(SBRGs)中的基因复制。研究发现这些重复类型在黑麦淀粉生物合成相关基因(SBRGs)中普遍存在,并且不同的SBRG的复制基因之间往往表现出表达差异,说明不同类型的基因复制可以丰富黑麦基因在重要生物过程中的遗传多样性(图4c),这些黑麦SBRGs的新变化可能为调控植物淀粉生物合成和性质提供新的酶活性,因此解析全套黑麦SBRGs有利于提高黑麦的产量潜力和营养品质。

 图4 黑麦基因重复及其对淀粉合成相关基因多样性的影响

5. 黑麦种子贮藏蛋白(SSP)基因位点的分离

与小麦和大麦相似,黑麦在胚乳组织中积累了丰富的储存蛋白SSPs。作者利用威宁基因组组装技术对黑麦SSP基因座进行了分析。

在威宁黑麦中未发现小麦低分子量麦谷蛋白亚基(LMW-GSs)或大麦B-hordein的同源序列(图5b),表明在黑麦进化过程中携带这些基因的染色体片段缺失,这可能是1BL1RS易位系小麦品种中,品质受影响的主要原因。并且在威宁黑麦基因组中未发现α-醇溶蛋白基因,这说明小麦及其近缘种的α-醇溶蛋白(α-gliadin)基因可能在小麦和黑麦分化之后进化产生的。这些SSP分析结果阐明了黑麦碱基因座的结构和组成,这将有助于进一步研究黑麦、小黑麦和小麦的加工和营养品质。

图5 黑麦碱位点分析

6. 转录因子(TF)抗病基因的注释和分析

作者利用iTAK预测了威宁黑麦和其他8种禾本科植物的TF基因,在注释的65个转录因子基因家族中,威宁黑麦有28个家族成员增加,其中AP2/ERF TF基因家族成员增加幅度较大。威宁黑麦的抗病相关基因(DRA)数量(1989)比乌拉尔图小麦(1621)、节节麦(1758)、大麦(1508)、二穗短柄草(1178)、水稻(1575)以及普通小麦的A(1836)、B(1728)和D(1888)亚基因组多。鉴于AP2/ERF TFs和DRA基因在植物对非生物逆境和生物逆境的反应中的重要作用,上述发现可能有助于黑麦和相关作物的有效遗传研究和分子改良。

 

7. 抽穗性状相关基因表达特征的研究

在长日照条件下,威宁黑麦比荆州黑麦提前抽穗10-12天(图6a),这与威宁黑麦茎尖分生组织发育更快有关(图6b)。在威宁黑麦基因组中,注释到在长日照条件下高表达的两个开花位点(FT)基因ScFT1(ScWN4R01G446100)和ScFT2(ScWN3R01G192500)。播种后7天和10天,ScFT1ScFT2在威宁黑麦中的表达水平显著高于荆州黑麦(图6c),且ScFT蛋白在黑麦中积累到相对较高水平,而荆州黑麦中几乎没有(图6d)。检测到的ScFT蛋白的大小(~29 kDa)比预测出的ScFT1和ScFT2的分子量大(~19 kDa)(图6d),表明ScFT蛋白具有潜在的翻译后修饰。用高效检测磷蛋白的磷酸标记SDS-PAGE分析表明,威宁黑麦中ScFT确实发生了翻译后磷酸化修饰。

作者突变了ScFT2磷酸化相关的两个残基(S76和T132),并为ScFT2构建了一系列去磷模拟位点(S76A、T132A和S76A/T132A)和磷模拟位点(S76D、T132D和S76D/T132D)。当使用马铃薯X病毒载体在烟草中进行外源表达时,ScFT2和去磷双突变体ScFT2S76A/T132A相对于游离GFP(对照)和其他ScFT2突变体,表现出持续促进烟草生长(图6e)。与GFP相比,ScFT2和三个去磷突变体(ScFT2S76A、ScFT2T132A及ScFT2S76A/T132A)的异位表达提高了开花植株的百分比,ScFT2S76A/T132A尤其明显,但在表达三个拟磷突变体(ScFT2S76D, ScFT2T132D, or ScFT2S76D/T132D)中没有观察到这种促进作用(图6f)。免疫印迹分析表明,ScFT2、ScFT2S76A、ScFT2T132A和ScFT2S76A/T132A在烟草植株中的积累量相当高,但ScFT2S76D、ScFT2T132D和ScFT2S76D/T132D在烟草植株中的积累量却很低(图6g)。因此,保守的S76和T132残基的改变影响了ScFT2控制植物开花的功能,这与ScFT2蛋白稳定性的改变有关。本研究首次发现FT磷酸化对开花时间控制的影响,为更全面地探索FT蛋白控制植物开花的分子和生化机制提供了新的途径。

作者进一步研究了光周期PhotoperiodPpd)基因的表达,该基因在长日照条件下正调控FT的表达。在威宁和荆州黑麦的转录组分析中发现了一个表达Ppd的基因ScPpd1(ScWN2R01G043000)。该基因在威宁黑麦内的表达非常早,在播种2 天后达到表达高峰;而荆州黑麦在播种4天后才达到高峰(图6h)。根据ScPpd1对黑麦抽穗期的调控作用,研究者利用威宁×荆州F2代群体,检测到与前期研究一致的三个主效抽穗期QTL(Hd2R、Hd5RHd6R)。

 图6 威宁黑麦早期抽穗性状的发育及基因表达特征

8. 黑麦驯化过程中染色体区域和基因座的挖掘。

对驯化基因的分析可以促进对作物性状的理解和改良,但在黑麦中这类基因的分子分析方面进展甚微。作者通过全基因组选择清除分析,利用在栽培黑麦和瓦维洛夫黑麦(S. vavilovii)之间鉴定的123647个SNPs,挖掘黑麦驯化相关染色体区域和基因座。DRI、FST、XP-CLR分析中,共同识别到11个选择信号(图7a-c)。通过与水稻和大麦的共线性比较,发现了一些可能的选择清除位点,包括已在水稻或大麦中已被功能分析的ScBC1ScBtrScGW2ScMOC1ScID1ScWx的同源基因(图7a-c)。

检测到的ScID1基因座包含一对具有相同编码序列的ScID1同源序列(ScWN6R01G057200和ScWN6R01G057300,下称ScID1.1ScID1.2)(图7d)。ScID1.1和ScID1.2蛋白与玉米ID1(63.19%)和水稻RID1(65.34%)具有很强的同源性,这两个蛋白在玉米和水稻中都被发现调控着从营养体向花发育的转换。ScID1.1ScID1.2在威宁黑麦幼叶中的表达水平高于荆州黑麦(图7e)。在威宁×荆州分离的F2群体中,ScID1JZ/JZ纯合植株的平均抽穗期显著晚于ScID1JZ/WNScID1WN/WN个体(图7f),这与荆州黑麦相对于威宁黑麦的晚花表型相一致(图6a)。以上结果表明ScID1可能参与了抽穗期的调控,并可能通过黑麦驯化进行选择,使作物成熟度得到适当的调整,以更好地适应生长环境。

 图7 黑麦驯化相关染色体区域和位点的鉴定与分析

 

总结

本研究对我国栽培的优良品种威宁黑麦进行了基因组测序,基因组组装大小为7.74 Gb,其中93.67%被挂载到7条染色体上,重复序列占总基因组的90.31%。并基于高质量基因组揭示了全基因组基因复制及其对淀粉生物合成基因的影响,解析了复杂储存蛋白基因座位点、早抽穗性状的基因表达特征以及黑麦中与驯化相关的染色体区域和基因座。本次研究结果对黑麦的基因组特性及其农艺性状调控基因有了新的认识,获得了对进一步研究黑麦驯化遗传基础可能有用的染色体区域和基因座。威宁黑麦基因组组装对于破解黑麦基因组生物学,深化比较谷类基因组学研究,加速黑麦及相关谷类作物的遗传改良具有重要价值。
 

PART TWO 团队介绍

河南农业大学“植物基因组学和分子育种” 研究团队组建于2017年4月,其主要研究方向是深入解析植物重要生命过程以及小麦等作物关键农艺性状控制的分子机理,发掘具有科学意义和育种实用价值的基因与优良变异,创制具有实用价值的新种质和新品种,为促进小麦等作物的遗传改良作出基础性、战略性、前瞻性和实用性贡献。
团队现有5位教授(王道文、杨建平、苟明月、郑旭、姬祥),其中国家杰出青年基金获得者1名。团队拥有实验室面积1440平方米,建有基因组学、分子生物学、分子育种等设施。团队主要学术带头人为王道文研究员,目前为河南农业大学农学院担任特聘教授,主要研究植物分子生物学和小麦遗传改良。王道文研究员以第一或通讯作者身份在SCI刊物 (Nature、Science、Nature genetics、PNAS、Plant Cell、Plant Journal、New Phytologist、Molecular Breeding等) 发表论文50余篇,获国家杰出青年基金支持,获得中华农业科技奖一等奖1项 (第二完成单位和第二完成人)。现主持国家重点研发计划项目“主要农作物品质性状形成的分子基础”的研究,并担任核心期刊“作物学报”常务编委、SCI刊物Scientific Reports编委。
团队成立后取得了一系列重大科研进展及成果,包括黑麦基因组测序和深度分析工作。在黑麦基因组解析工作中,该团队利用三代DNA技术,结合Hi-C染色质构象捕捉技术的应用,获得了黑麦全基因组范围内整个染色质 DNA 在空间位置上的关系,在此基础上实现了黑麦基因组序列的组装、排序和定向,以及整个基因组的注释分析工作,成果最终发表在国际顶级科研期刊《Nature genetics》上。
百迈客生物科技有限公司(Biomarker Technologies)成立于2009年5月,是一家高新技术企业,公司基于功能基因组学的BT+IT(高通量基因测序技术、生物信息技术、高性能生物云计算技术)技术,面向广大科研工作者提供以综合科技服务、BMKCloud生物云分析、二代及三代高通量测序分析,仪器,试剂等为主的科技服务。公司目前拥有Nanopore、Pacbio、Illumina、Waters、10X genomics等主流服务平台,构建了基于云架构的自主生物云计算分析平台—百迈客云,提供涵盖人重外显子、三维基因组、单细胞与空间转录组、基因组de novo、转录调控、微生物、群体遗传、质谱及表观遗传等研究方向的技术服务。自公司成立起,服务客户在《Cell》、《Nature》、《Nature Genetics》、《Nature Communications》、《Plant Cell》、《PNAS》等学术刊物发表论文数千篇,拥有国家发明专利技术40余项,软件著作权近200余项。

 

最近文章