【Nature Genetics】 百迈客助力破译同源四倍体甘蔗基因组

日前,福建农林大学基因组研究中心明瑞光课题组首次完成了同源多倍体甘蔗基因组密码的破译,该研究成果”Allele-defined genome of the autopolyploid sugarcane Saccharum spontaneum L.”于2018年10月8日刊登在Nature Genetics上。本文的通讯作者为明瑞光教授,第一作者为张积森教授。
百迈客有幸也参与了甘蔗基因组组装的部分工作,我们希望通过此邮件与老师您分享该研究成果,点击此处即可获取文献原文。

英文题目:Allele-defined genome of theautopolyploid sugarcane Saccharum spontaneum L.
中文题目:同源多倍体甘蔗(Saccharum spontaneum L)基因组等位基因鉴定
发表杂志:Nature Genetics
影响因子:27.125
发表时间:2018.10.08
合作单位:福建农林大学基因组与生物技术研究中心

栽培甘蔗的单倍型个体S.spontaneum“AP85-441”(1n = 4x = 32) 进行基因组denovo测序研究。
64份甘蔗(Saccharum spontaneum)群体材料进行遗传多样性研究。

二代280-bp和500-bp(PE) 小片段文库(Illumina HiSeq 2500)
BAC文库(Illumina HiSeq 2500,PE250);三代大片段文库~20kb SMRTbellTM(PacbioRSII)
Hi-C文库(HindIII酶切),500-700bp小片段文库(HiSeqX ten,PE150)

甘蔗基因组denovo
利用BAC文库进行二代测序,ALLPATH-LG,SPAdes 和SOAPdenovo2进行初步组装,进一步利用87X 三代PacBio数据进行纠错,CANU进行组装,组装基因组3.13G,contigN50=45 kb(流式评估基因组大小:3.36G);通过Hi-C染色体挂载技术,针对多倍体染色挂载最新算法ALLHIC,进一步将contig水平提升至染色体水平,挂载率达到93%;通过BUSCO和二代数据回比评估基因组完整性高达97.3%。再通过MAKER对同源多倍体甘蔗特异等位基因进行手动注释,以获得高质量的甘蔗基因组

图1 S. spontaneum AP85-441染色体与高粱染色体的比对

基础染色体数目的减少
AP85-441基因组的组装显示了S.spontaneum的染色体数目从10降到8,而这与频繁复制的古复制染色体对相关,通过与高粱的聚类比对,发现高粱祖先5染色体和8号染色体同源物经历了染色体裂变(图2)。SbChr05(A12)的祖先染色体断裂分为两个主要部分,即C5S(A12S)和C5L(A12L),分别转移到SbChr06(A2)和SbChr07(A5)的祖先染色体;SbChr8(A11)的祖先染色体断裂为两个主要的部分,即C8S(A11S)和C8L(A11L),分别转移到SbChr09(A6)和SbChr02(A7+ A9)的祖先染色体中。SbChr8和SsChr5之间及SbChr5和SsChr7之间近乎同源的短片段是在高粱与甘蔗分化前,高粱SSA形成于13.4MYA同源基因的残留物,同时发现,S5中较小的SSA区域和S8中SSA的较大区域在重排的AP85-441基因组中也是保守的。

图2 禾本科染色体数进化(高粱n= 10到甘蔗n= 8)

S.spontaneum的多倍体化分析
进一步研究发现了甘蔗(Saccharum spontaneum L.)染色体由高粱(Sorghum)演变进化过程中经历了染色体断裂与融合后,发生了两次WGD事件(图3);对甘蔗的基因组的多倍化研究中发现,通过两次全基因组复制事件的发生,导致了甘蔗染色体的自发加倍过程;对同源多倍体甘蔗的特异等位基因的鉴定作为本研究的另一亮点,文章在鉴定等位基因的同时,进一步分析研究了等位基因的表达模式,结果发现不同单倍型表达模式相似,并无明显差异;对甘蔗C4光合作用的研究中鉴定了24个基因,7种关键酶参与NADP-MEC4途径;在甘蔗中蔗糖对的积累的研究中发现与高粱相比甘蔗中的液泡膜糖转运蛋白(TSTs,一种蔗糖转运蛋白)发生了基因家族的扩张,所以推测TSTs参与蔗糖在液泡中的积累;S.spontaneum为现代栽培甘蔗提供了抗病性基因,在对其研究中发现,甘蔗中的80%的NBS编码基因位于四个重排染色体(Ss02,Ss05,Ss06和Ss07)上,其中51%位于重排区域。

图3 AP85-441甘蔗基因组circos图

S.spontaneum的起源与遗传多样性分析
通过对64份甘蔗(Saccharum spontaneum)群体材料遗传多样性研究,发现其具有广泛的自然部分范围,遍及亚洲,印度次大陆,地中海和非洲,且自然种群具有广泛的表型,遗传和倍性水平多样性(图4)。研究发现,与高粱相比具有大规模染色体重排的S. spontaneum区域具有比非重排区域更高的遗传多样性,并且可能经历了更强的平衡选择。虽然几条单独的染色体没有显示出显著差异,但是比较所有染色体上的平均值显示重排区域中的核苷酸多样性(0.00025±0.00003)远高于非重排区域中的核苷酸多样性(0.00021±0.00001),染色体重排区域的Tajima’s D(-0.659±0.052)远远高于非重排区(-0.720±0.011),重排区的SNP密度(360.27±48.41) 高于非重排区域(297.46±12.65, P=0.001798);此外,GO富集显示,染色体非重排区主要富集到与基本生命周期,光合作用,呼吸作用和ATP合成的通路上。重排区主要富集在GO生物合成和代谢,跨膜转运和离子结合通路上。

   S. spontaneum重排区具有高度的遗传多样性将更适应环境压力,例如对各种非生物胁迫(干旱,盐度,碱性,金属离子等)的反应,这些受到次生细胞生物合成和代谢,跨膜转运和离子结合的控制的基因在这些区域可以检测到。在多倍化事件后,重排区域经历了更强的平衡选择。
图4 64份甘蔗的群体结构与进化关系分析

本研究利用百迈客复杂基因组Hi-C建库测序技术,并结合明瑞光课题组独立研发ALLHiC算法成功组装了高复杂同源多倍体甘蔗基因组AP85-441,高质量的甘蔗基因组的获得,为后续研究其蔗糖含量,抗性等性状及农业育种基础奠定了基础。

 

若您对相关内容感兴趣或有疑问,欢迎点击下方按钮随时与我们进行联系,我们将免费为您设计方案。

 

最近文章