利用比较基因组与群体分析的方法,对亚麻驯化改良研究

亚麻(Linum usitatisimum L.)作为最早驯化的作物之一,已8000多年的历史,为人类提供了丰富的油和纤维的来源。目前的栽培亚麻有油用亚麻和纤维用亚麻两种主要类型,它们在形态和农艺性状上存在显著差异。近日,由甘肃省农科院和北京百迈客等单位合作的“Gnomic comparison and population diversity analysis provide insights into the domestication and improvement of flax ”荣登iScience, 其中张建平研究员,党占海研究员,刘头明研究员, 百迈客CEO郑洪坤为本文通讯作者。

材料方法

基因组组装材料:油用亚麻Longya-10;纤维用亚麻Heiya-14;白亚麻pale flax
测序平台:Illumina HiSeq2500
群体研究:83份亚麻材料(24份地方品种、47份油用亚麻栽培种和12份纤维用亚麻栽培种)
辅助基因预测:Longya-10材料根,茎,叶,花,种子混样RNA-Seq
转录组测序:开花后21天的果实与茎

结果

1. 基因组组装

对油用亚麻品种Longya-10、纤维亚麻品种Heiya-14和pale flax分别测序得到68.2Gb,73.5Gb和 49.1Gb数据,组装出306.0Mb、303.7Mb和293.5 Mb基因组,其中contig N50/scaffold N50分别为131Kb/ 1,235Kb, 156Kb/700Kb和59Kb/384 Kb,后期利用HiC技术与遗传图谱辅助Longya-10基因组组装,将434 scaffolds组装至染色体水平,在每个基因组中预测到大约43,500个编码基因和2600-2800个非编码RNA;系统发育分析表明,栽培亚麻和白亚麻在大约232万年前发生了分化,自古被子植物的六倍化事件以来,亚麻发生了两次全基因组复制事件。

2. 比较基因组研究
之前有报道称栽培亚麻起源于白亚麻,作者将Longya-10与Heiya-14基因组分别与白亚麻进行比较分析,在Longya-10中共鉴定到3,623,057 SNV和555,580 个InDel,Heiya-14中鉴定到3,686,366个SNV和557,691个InDel。分别有13.7%和14.2%的SNV落入CDS区域,其中一半以上是非同义变异。此外,与白亚麻相比,482个含有这些非同义变异的基因在两个品种中得到了正选择,其中23个基因与油脂和纤维生物合成相关。作者对这两个品种中含有共同非同义SNV和INDEL的基因进行了注释。结果表明,在亚麻驯化过程中,开花时间相关基因FCA、果实开裂相关基因ALC、次生细胞壁生物合成相关基因MYB83和种子油脂生物合成相关基因LEC1子发生了变异。对这些变异基因进行功能富集分析,发现植物激素信号转导、戊糖和葡萄糖醛酸转换、淀粉和蔗糖代谢以及神经鞘糖脂生物合成相关通路显著富集,表明植株结构(株高、叶形、分枝方式、直立/匍匐等)、种子产量和/或营养品质为主要驯化目标。

 

3. 群体进化分析
对83份亚麻材料个体重测序,共产生615 GB数据,平均深度为11.2×,覆盖率为97.4%,将测序数据与Longya-10基因组比对,共得到2,245,463个SNP和394,658个Indels。系统发育树与群体结构分析结果表明,83份亚麻材料分为三大类群,分别属地方种、油用亚麻和纤维亚麻。油用亚麻与地方种的亲缘关系较近,纤维亚麻的群体多样性最低(π=9.80×10-4),且具有最长连锁不平衡(LD)衰减距离(66.7Kb)。SMC++有效群体分析表明,亚麻经历了强烈的瓶颈效应。

4. 亚麻改良过程中的选择清除分析

作物改良常常导致受选择的区域核酸多态性降低,将油用亚麻群体和纤维亚麻群体分别与地方种比较分析,油用亚麻中检测到108个选择清除区域(长度为15.5Mb,1,958个基因),纤维亚麻中有60个选择清除区域(长度为8.2Mb,1018个基因),27个选择清除区域重叠。其中α生物素羧基载体蛋白(LuBCCP)、脂氧合酶(LuLOX)、脂肪酰基ACP硫酯酶A(LuFatA)、脂质转移蛋白(LuLTP)和丙酮酸脱氢酶复合物E2组分(LuPDH-E2)等油脂相关基因以及种子大小相关基因LuBIN2LuGW5在油用亚麻中受到选择。纤维亚麻中,次生细胞壁生物合成相关基因(LuMYB46-1LuXTHLuROPGAP3)和植物株高相关基因(LuGA3oxLuGA20oxLuGID)受到选择。

之前有报道纤维亚麻是从油用亚麻驯化而来,将油用亚麻与纤维亚麻进行比较分析,存在47个选择清除区域,其中50.9%与纤维亚麻相对于地方种的选择区域重合。这表明在纤维用亚麻改良过程中,这些区域持续受到很强的选择压力。大约一半的基因(426/867个基因)仅在油用亚麻和纤维亚麻比较中发现,包含内切-β-1,4-葡聚糖酶(LuKorrigan)、果胶甲酯酶(LuPME)和焦磷酸铜合成酶(LuCPS)等。作者将选择清除区域与之前报道的QTL/GWAS位点比较分析,发现2个硬脂酸相关的QTL与油用亚麻选择区域重叠,一个株高相关的GWAS位点与纤维亚麻选择区域重叠,另外3个油合成相关的QTL与纤维亚麻选择区域重叠,这说明亚麻在驯化过程中受到双重选择。

5. MYB46/MYB83基因的进化及其在亚麻次生细胞壁生物合成中的作用

纤维是植物中一种特殊的细胞,具有加厚的次生细胞壁。AtMYB83/MYB46是拟南芥次生细胞壁生物合成的主要调控因子。研究发现,在亚麻、杨树、苹果、苜蓿和木薯中,MYB46/MYB83基因发生了物种特异性复制。8个已鉴定的LuMYB46/LuMYB83同源基因,4个在栽培种中高表达。此外,LuMYB46-1LuMYB43-2LuMYB83-1在栽培亚麻中发生了多种变异。与白亚麻相比,LuMYB83-1在两个栽培种中检测到21bp的插入,LuMYB46-1在亚麻改良期间受到了强烈的选择。LuMYB46-2在两个栽培种之间也有不同的插入/缺失变异。在亚麻中,四对MYB46/MYB83姊妹基因位于共线基因组区域,最近的一次分裂发生在最近一次WGD发生的时间,这意味着这次WGD事件导致了MYB46/MYB83基因在亚麻基因组中的最新一次扩增。这些结果表明,在亚麻驯化和改良过程中,LuMYB46/LuMYB83基因的扩张和定向选择可能在重塑亚麻形态结构中起着至关重要的作用,qRT-PCR与RNA-Seq数据再次证明此结论。

 

                                    

最近文章