在保障国家粮食安全和乡村振兴的征程中,小麦作为“粮仓支柱”,其产量和质量的提升一直是科学家关注的焦点。然而,小麦基因组庞大、结构复杂且富含高度重复序列,长期以来阻碍了小麦研究和育种应用的深入。
2025年4月7日,潍坊现代农业山东省实验室/北京大学现代农业研究院和小麦育种全国重点实验室邓兴旺、何航、李博生团队在国际顶尖期刊《自然-遗传学》(Nature Genetics)上发表题为“A telomere-to-telomere genome assembly coupled with multi-omic data provides insights into the evolution of hexaploid bread wheat”的突破性成果:成功绘制了六倍体小麦的端粒到端粒(T2T)完整基因组图谱,实现了小麦基因组从“头”到“尾”无缺口的精确组装。这一在山东完成的成果,为我国主粮作物高水平科技自立自强、牢牢把握粮食安全主动权提供了重要支撑。
百迈客生物为该研究提供了三代测序服务。
1.多种高精度测序组合策略:搭建小麦完整基因组拼图的基石
研究团队利用PacBio HiFi高精度测序和ONT超长读长测序等前沿技术,结合多种算法,成功构建了六倍体小麦T2T基因组,命名为“CS-IAAS”版本1.0。该基因组总长度达14.51 Gb(约145亿个碱基),实现了42条小麦染色体从端粒到端粒的无缺口拼接(图1)。相比以往,这一图谱在完整性、连续性和准确性上实现了质的飞跃,为功能基因组学研究奠定了坚实基础。这一成果不仅展示了我国在农业基因组学研究领域的国际领先地位,还为粮食安全战略提供了强有力的科技支撑。

图1.六倍体小麦T2T基因组精确完整图,即CS-IAAS版本1.0
2.揭开染色体复杂区域的秘密
借助完整基因组图谱,研究团队首次清晰解析了小麦基因组中着丝粒、端粒和核糖体DNA重复序列(rDNA阵列)等复杂区域。其中,着丝粒长度相比之前报道增加了47%,这一精确鉴定为小麦着丝粒功能和进化提供了新的视角。研究发现,着丝粒区域主要由大量重复的转座子序列构成,且A、B、D三个亚基因组的着丝粒独立进化,各有不同。并在小麦多倍体形成中,相对二倍体的着丝粒长度有了大幅增加。此外,D亚基因组中的Retand序列还“渗透”进了A和B亚基因组的着丝粒区域,揭示了亚基因组间的相互影响。
端粒作为染色体的“保护帽”,在小麦中同时存在植物和脊椎动物两种风格的重复序列,这一现象在植物中极为罕见。rDNA阵列则被解析为核糖体RNA的重复基因簇,其周围主要由转座子序列构成,不同染色体间的这些区域在组成上存在差异。完整测出这些区域后,为研究这些复杂区域的进化提供了新线索。
3.四倍体到六倍体:染色体“大变身”
现代普通小麦是由三个祖先物种杂交形成的六倍体作物。研究团队利用T2T基因组图谱,揭示了小麦从四倍体演化为六倍体过程中发生的23处主要染色体片段倒位,总长度约5.18亿个碱基。这些倒位在现代小麦中全部保留,且断点处富含特殊短重复序列,推测对染色体折断和重新连接发挥了作用。

图2. 二、四、六倍体小麦染色体重排与断点结构解析
4.重复序列:小麦进化的幕后推手
小麦基因组中大量重复序列并非“冗余”,而是驱动其进化的重要力量。研究发现,转座子和片段重复对小麦基因组演化影响深远。两个近期大量扩增的转座子家族表明,这些“跳跃基因”在小麦演化晚近时期突然活跃。此外,长末端重复逆转座子(LTR-RT)在小麦进化关键节点出现两次“大爆发”,为基因组结构调整提供了原材料。
片段重复则为基因创新提供了“备份”,使小麦在进化中积累了丰富的遗传变异,增强了环境适应力。这些发现改变了重复序列是“基因组垃圾”的传统认知,揭示了其在基因组扩张、基因复制和多样化中的创造性作用。
5.基因注释升级:小麦育种的新希望
高质量基因组图谱为基因注释提供了前所未有的精度。研究团队结合RNA测序和全长转录本信息,注释了141,035个高置信度蛋白编码基因,并鉴定出大量可变剪接形式。相比以往版本,新增了34,120个高置信度基因,其中包括许多NLR抗病基因,为抗病育种提供了新靶点。为确保注释准确性,研究团队还通过蛋白质组学手段验证了基因结构,进一步提高了注释可靠性。这份经过严格校准的基因目录将成为功能基因组学研究的宝贵资源。
6.迈入小麦基因组与精准分子设计育种研究的新纪元
六倍体小麦端粒到端粒完整基因组图谱的发布,标志着小麦基因组研究进入新阶段。这一成果不仅深化了对小麦基因组结构和进化机制的理解,还为解析其他复杂多倍体作物基因组提供了范例。未来,依托这一高质量参考基因组,科学家将更精准地挖掘与产量、品质、抗病性相关的关键基因,为小麦品种改良带来革命性突破。
内容来源于北京大学现代农业研究院,侵删