2024年3月17日,凯里学院和贵州植物园在国际学术期刊Horticulture Research发表一项重要研究成果,题为:Chromosome-scale genome, together with transcriptome and metabolome, provides insights into the evolution and anthocyanin biosynthesis of Rubus rosaefolius Sm. (Rosaceae)。该研究通过基因组、转录组和代谢组的方法解析蔷薇科空心藨进化和花青素合成机制。
文章标题:Chromosome-scale genome, together with transcriptome and metabolome, provides insights into the evolution and anthocyanin biosynthesis of Rubus rosaefolius Sm. (Rosaceae)
期刊名称:Horticulture Research
影响因子:7.6
合作单位:凯里学院和贵州植物园
研究对象:蔷薇科空心藨
研究方法:基因组、转录组和植物广靶代谢组学等
百迈客生物为该研究提供了基因组、转录组和植物广靶代谢组检测和分析服务。
研究背景
蔷薇属(蔷薇科)有12个亚属,700余种,除南极洲外分布在世界各地。蔷薇属植物的组织,尤其是成熟的浆果,通常含有多种促进健康的化合物(如花青素、酚酸和类黄酮)和营养物质(如纤维素、维生素E和天然色素)。自古以来,它们就被用作药物和水果。
空心藨(Rubus rosifolius Sm.)是一种天然生长在东亚、东南亚、南亚、大洋洲、非洲和马达加斯加的红色覆盆子。空心藨的枝、叶、根长期以来被用于止咳、祛风、止血、湿。成熟的蔷薇果实含有丰富的花青素、酚类物质、三萜、甾醇等生物活性成分。因此,它具有多种药理作用,包括抗氧化、镇痛、抗菌、防腐、抗增殖、抗癌、利尿、降压等。此外,成熟的蔷薇果实具有独特的酸甜味道,颜色鲜艳,很有吸引力。综上所述,蔷薇是一种吸引人的野果,具有很高的商业价值,因此具有很大的驯化和栽培潜力。
实验材料
该研究以贵州植物园覆盆子种质苗圃种植的一株蔷薇为研究对象,进行了基因组、转录组和代谢组实验。对幼叶进行基因组DNA提取分析。幼叶、幼茎、幼根、花萼、花瓣、雄蕊和3个幼果,发育天数分别为5、8和11天,三种着色浆果,分别发育14、17和19天,对发育21、23和25天的3个成熟果实进行RNA提取,进行转录组分析。同样的浆果也被用来进行植物广靶代谢组分析。
研究结果
1.基因组分析——基因组草图组装与注释
该研究首先构建并测序了空心藨的短读文库(350 bp),获得了59.76 Gb的数据和97.53%的合格reads (>Q20)。K-mer分析,估计空心藨基因组大小为220.50 Mb,重复率为33.31%,杂合度为1.64%。然后,构建空心藨长读文库并进行测序,组装成241.76 Mb的基因组草图,由141个连续序列(contigs)组成(N50 = 15.36 Mb)。最后,构建并测序了空心藨的Hi-C文库,获得了> 1.65亿个读对。
利用这些有效的互作读对对初步的基因组草图进行校正,得到了总共221.95 Mb的最终草图,包含138个contigs (N50 = 16.13 Mb)。这些contigs进一步聚集成131个支架(N50 = 30.0 Mb)。70个支架共219.02 Mb,占总组装序列的98.68%,占估计基因组大小的99.33%,锚定在7条假染色体上。其中,20个支架(211.23 Mb)的位置和方向被确定,占锚定序列的96.44%。通过blast of essential genes (CEG)数据库和BUSCO数据库来估计该草图基因组的组装完整性,共鉴定出458个CEG的456个同源物(99.56%)和1614个BUSCO的1590个同源物(98.51%)。这些结果表明,组装的空心藨基因组草图具有较高的完整性。综合各组组或支架的组装完整性、无间隙度、N50等指标,该研究组装的草图基因组超过了其他覆盆子物种。
从空心藨基因组组装草图中,通过从头算预测、同源性预测和RNA-seq预测相结合,共鉴定出28067个蛋白编码基因,在这些预测的基因中,1584个(98.14%)与BUSCOs(1614)同源,26173个(93.25%)可以被注释为具有生物学或分子功能,这些带注释的转座元件和蛋白质编码基因不均匀地分布在红花的染色体上(图1)。从红花草图基因组中鉴定了1500多个RNA基因,主要是rRNA和tRNA基因,以及一些假基因。
2.基因组分析——蔷薇与其他9种植物的系统发育关系及基因家族分析
为了研究空心藨的进化关系,该研究分析比较了玫瑰、黄连、鹅掌楸、水稻、拟南芥、月季、花蔷薇、桃李、中国栗、西方栗的基因集数据。系统发育树显示,蔷薇科出现在白垩纪,覆盆子出现在古近纪,空心藨和另一种红覆盆子R. chingii在1728-3644万年前(mya)从最近的共同祖先分化而来,随后空心藨的211个基因家族和36个基因家族分别扩张和收缩(图2),这些扩展家族中的基因主要富集于代谢途径,如“DNA聚合酶”、“光合作用”、“昼夜节律”和“半乳糖代谢”。
3.基因组分析——基因组共线性分析和重复事件分析
所有的植物都有一个或远或近的共同祖先。通过共线性分析发现:在1号染色体的一端和其他6条染色体上,发现了完整且平行的同源物,但在1号染色体的另一端缺失了大同源块(图3a)。这些结果表明,空心藨和红覆盆子之间没有发生大的染色体变异,但在空心藨和红覆盆子基因组草图的组装或注释中隐藏了错误。该研究发现,空心藨和红覆盆子之间所有染色体的共线性几乎是完整的(图3b),这表明上述1号染色体的组装或注释错误可能在空心藨中没有发生。当忽略单倍型中支架组装方向的干扰时,1、2、3、5、7号染色体几乎完全平行共线性,4号染色体可能发生较大反转,6号染色体可能发生3次或更少的反转(图3b)。这些发现表明,随着亲缘关系距离的增加,复杂染色体变异的数量增加。
全基因组复制(WGD)分析发现。蔷薇科其他成员与西方蔷薇科同属的共同祖先曾发生过WGD事件。
4.代谢组分析——浆果中花青素及其积累动态
已有研究表明,空心藨浆果中含有丰富的花青素,特别是矢车菊素和天竺葵素。该研究利用植物广靶代谢组技术鉴定到1330种代谢物,包括121种氨基酸和衍生物、248种酚酸、241种黄酮类、78种生物碱和151种萜类和有机酸。在黄酮类化合物中,有17种花青素在9种不同时期的浆果中检测到,幼龄期(N1)、着色期(N2)和成熟期(N3)分别有3个、3个和3个。在N1向N2(发育期)过渡期间,总花青素和大多数种类花青素的浓度保持相对稳定,只有天竺葵素-3- O-葡萄糖苷、天竺葵素-3-木糖苷和天竺葵素-3-O -(6’’- O -丙二酰基)葡萄糖苷继续增加(图5),N2 ~ N3(发育阶段)5种花青素(天竺葵素-3-O- (6 ’’-O-乙酰基)糖苷和芍药色素-3-O-糖苷)浓度保持相对稳定,2种花青素(天竺葵素-3-O-芦丁苷和飞燕草素- 3-O-(6’’-O-咖啡酰)糖苷)浓度略有下降,此外,总花青素和其他10种花青素均呈上升趋势。8种(如天竺葵素-3- O -半乳糖苷和天竺葵素-3- O (6’’-O -乙酰基)葡萄糖苷)略有增加,2种(天竺葵素-3- O -(6’’-O-丙二酰基)葡萄糖苷)急剧增加(图5),这些结果表明,空心藨花青素的产生主要发生在成熟阶段,其主要贡献物质是红色色素天竺葵素3-O -葡萄糖苷和天竺葵素3- O -(6’’ -O-丙二酰基) 葡萄糖苷。
5.转录组分析——花青素生物合成相关的结构基因
转录组共鉴定出23997个基因在空心藨果实中不同水平表达。根据KEGG注释,共鉴定出11个结构基因,其中花青素3-O-葡萄糖基转移酶(RrBZ1)基因6个,分属于5个家族,2个花青素3-O-葡萄糖苷2’’-O-木糖基转移酶(RrUGT79B1)基因属于一个家族,1个花青素3- O-葡萄糖苷5-O-葡萄糖基转移酶(RrUGT75C1)基因和2个花青素3-O-葡萄糖苷6’-O-酰基转移酶(Rr3AT)基因属于两个家族,参与了“花青素生物合成”途径。此外,该研究还鉴定出22个结构基因,其中查尔酮异构酶(RrCHI)基因10个,属于6个家族,5个查尔酮合成酶(RrCHS)基因,属于4个家族,4个双功能flavanol 4-还原酶/flavanone 4-还原酶(RrDFR)基因,分属于3个家族,一个类黄酮3’-单加氧酶(RrCYP75B1)基因,一个柚皮素3-双加氧酶(RrF3H)基因,和一个花青素合成酶(RrANS)基因,参与“类黄酮生物合成”,在花青素生物合成中起着至关重要的上游作用。在这33个结构基因中,Rro07G000520.1 (RrBZ1)、Rro04G036130.1 (RrBZ1)、Rro01G021400.1 (RrF3H)、Rro07G031240.1 (RrDFR)、Rro04G035990.1 (RrCHS)、Rro04G036130.1 (RrCHS)、Rro07G006550.1 (RrCHI)和Rro05G014010.1 (RrANS)在浆果组织中表达量相对较高(图6)。该研究推测这8个基因是参与空心藨花青素生物合成的主要基因。共有33个结构基因在空心藨的花、叶和根组织中表达,但没有一个在浆果中表达。这一发现表明,花青素代谢存在于空心藨的各个组织中,并不是单独存在于果实中。
6.联合分析——花青素生物合成的基因调控
为了探索空心藨红浆果中花青素生物合成调控的分子机制,该研究对空心藨红浆果幼龄期和成熟期的转录组和代谢组进行了相关性分析。在成熟浆果中发现的主要花青素——芍药苷-3-O-葡萄糖苷和芍药苷-3-O-(6’’-O-丙二酰基)葡萄糖苷被鉴定为显著差异积累代谢产物(DAMs),其中11个结构基因被发现为差异表达基因(DEGs)。其中,Rro07G000520.1 (RrBZ1)、rro07g035990.1和rro07g036130.1 (RrCHS)、rro07g06550.1 (RrCHI)、rro07g021400.1 (RrF3H)、Rro07G031240.1 (RrDFR)和Rro05G014010.1 (RrANS)与芍药苷-3-O-葡萄糖苷积累呈正相关,而Rro07g033620.1、Rro07g024760.1 (RrBZ1)、Rro07G009270.1 (RrUGT75C1)、Rro04G021540.1 (RrUGT79B1)与这两种物质呈负相关(图6b)。编码属于MYB、bHLH、AP2、bZIP、NAC和TCP家族转录因子的几个DEGs的表达与上述一个或多个结构基因和两个DEGs呈显著正相关或负相关(图6b)。这些发现表明转录因子广泛参与了空心藨花青素生物合成的调控。通过蛋白-蛋白相互作用(PPI)分析,该研究发现Rro4G033620蛋白(RrBZ1)与三甲基鸟苷合成酶1 (RrTGS1)直接相互作用,Rro5G003920蛋白(RrBZ1)直接与铁氧还蛋白C1 (RrFDX1)、CCAAT结合转录因子(RrNFYA)、谷氨酸合成酶1 (RrGLU1)和组蛋白样转录因子(RrCBF/NF-Y)相互作用,Rro1G021400蛋白(RrF3H)直接与RrFDR和RrANR相互作用(图6c)。上述结果表明,空心藨花青素的合成受RNA甲基化、结构基因编码蛋白和转录因子的相互作用调控。
研究总结
该研究获得了一个高质量的染色体水平基因组草图,包含35.7%的重复序列和28067个蛋白质编码基因。追踪了蔷薇科谱系特异性WGD事件,产生5090个目前可检测的dgps,其中大多数进行了纯化选择。空心藨成熟果实花青素的积累主要是由芍药苷-3-O-葡萄糖苷和芍药苷-3-O-(6’’-O-丙二酰基)葡萄糖苷引起的。该研究发现了许多与花青素生物合成有关的结构基因,它们的表达可能受到转录因子和结构基因编码的RNA甲基化和蛋白质相互作用等遗传机制的调控。研究结果可为空心藨及其他蔷薇属植物的定向驯化和育种提供参考。