分类: 转录组测序

作为国内第三代测序领域的领航者,百迈客遵循ISO 15189国际质量体系要求建成了分子遗传实验室,并率先引进了PacBio RSII和PacBio Sequel第三代测序仪。截至2017年8月,百迈客已经完成了多个物种的全长转录组测序,主要包括花卉、作物、蔬果、水产等。基于多年的项目积累,我们拥有丰富的样本处理与数据分析的经验,助力文章的快速发表。今天和大家分享一篇公司的三代项目文章。

研究背景

甘薯是许多发展中国家重要的作物之一,也是重要的能量来源。甘薯是同源六倍体植物,基因组大小约3-4G,目前还没有高质量的参考基因组。甘薯采用异花授粉的繁殖方式,自交不孕,导致基因组的杂合度高,目前还没有关于甘薯正向遗传学研究的报道。几乎所有关于甘薯转录本的研究都是采用转录组测序的方法,没有获得大规模的全长cDNA序列,因此阻碍了甘薯功能基因组学和分子育种研究的进展。长期以来,人们一直认为甘薯有可能由二倍体祖先野生甘薯(I. trifida)进化而来,但是没有确凿的证据。

研究目的

通过2+3联合测序的方法获得甘薯和野生甘薯的全长转录本,揭示二者的进化关系。

材料方法

实验材料
甘薯和野生甘薯,不同组织(幼叶、成熟叶、茎尖、茎秆、须根、起始块根、膨大块根和成熟块根)分别等重量混合,提取RNA用于三代测序;同样的材料用于二代测序。
测序方法及数据量
百迈客Pacbio RSII:构建1-2k、2-3k、>3k的3个文库,每个文库分别测1个、2个、1个cell,共8个cell。
百迈客Illumina HiSeq 2500:甘薯和野生甘薯各测了17G和11G数据。

技术路线

研究结果

5.1 全长转录本的统计及结构注释分析
统计三代的数据发现:甘薯得到220,035 个ROI(reads of insert),其中全长非嵌合转录本(Full-Length Non-Chimeric, FLNC)占49.9%,非全长转录本(Non-Full-Length, NFL)占46.6%;野生甘薯得到195,188 个ROI,其中FLNC 和NFL 分别占52.1%和43.9%。对三代的数据进行矫正(自我纠错+二代数据矫正),甘薯和野生甘薯分别获得了53,861和51,184个非冗余转录本。此外,甘薯和野生甘薯分别预测到了104,540 和94,174 个ORF,全长转录本(同时含有5’-UTR,CDS和3’-UTR)分别有34,963和33,637个。甘薯和野生甘薯分别鉴定到了 25,315和 27,090 个SSR,以及471 和531 个lncRNA。

Figure 1. 对三代测序的数据进行分类统计和结构注释

5.2 甘薯、野生甘薯与其它植物的CDS比较分析
为了评估甘薯、野生甘薯的转录本和其他植物基因的相似性,我们比较了甘薯、野生甘薯与其他植物的开源CDS数据库,包括红苔藤、野生甘薯、牵牛花、烟草、马铃薯、大豆、拟南芥和水稻。结果表明甘薯和野生甘薯大多数的转录本都是同源的,说明这两个物种拥有一个大致相同的基因库。观察高比例的转录本发现,尽管这些物种中的大量基因在进化过程中存在着巨大的差异,但仍然共有一些短的motif,说明这些基因在进化上显示出高度的保守性。

Figure 2. 比较甘薯、野生甘薯和其他植物的转录本

5.3 全长转录本的结构分析
三代测序得到的全长cDNA对于研究基因的结构非常有用,例如分析外显子-内含子的结构。我们随机挑选了50个基因进行比较,发现这些基因含有的外显子数目在甘薯、野生甘薯和拟南芥三个植物中的分布是相似的。

Figure 3. 分析甘薯、野生甘薯和拟南芥的外显子-内含子结构

5.4 甘薯和野生型甘薯的Ka/Ks分析
人们普遍认为二倍体野生甘薯是六倍体作物甘薯的祖先,为了寻找参与甘薯进化的候选基因,我们研究了甘薯和野生甘薯的基因选择模式。首先比较了二者的完整转录本数据集,去除有多种同源性可能的那些转录本,确定了1269个假定的甘薯和野生甘薯之间的同源基因对。随后,计算了每个基因对的Ka/Ks比值,大多数基因对的Ka/Ks比值都小于1,只有56个基因对的Ka/Ks比值大于1,表明在甘薯的进化或驯化过程中,大多数基因都是受到纯化选择的。而受到正向选择的这些基因将作为后续研究的重点。

Figure 4. 分析甘薯和野生甘薯同源基因对的Ka/Ks比值

创新点

1,对于无参或者参考基因组不好的物种,全长转录组可以获得转录本全长序列,完善基因组注释的信息。
2,通过全长比较转录组分析研究近源物种间的进化关系。

参考文献:
Generation and comparative analysis of full-length transcriptomes in sweetpotato and its putative wild ancestor I. trifida(bioRxiv在线发表,2017)

推荐文章