泛基因组(Pan-genome)即某一物种全部基因的总称,这里这个全部基因是有别于个体基因组的基因的。一个个体的基因组是这个物种基因组的代表。因此,以一个基因组为模板的分析不能全面的反应物种基因水平的全部遗传信息,尤其是在研究同一物种中差异巨大的不同亚种或者变种,此类特有片段的差异往往要比共有片段中的差异更为重要。分析核心基因和非核心基因的基本情况,并从特有基因序列的角度来研究物种内的差异。
泛基因组主要有3种构建方法:Map to pan,Iterative assembly和De novo assembly。从头组装(De novo assembly):是构建泛基因组或者参考基因组最经典的方法,分别对多个个体分别进行从头组装并且注释,然后将所得的每个个体的组装好的序列与参考序列基因组进行互相比对,找出比对不上的区域或者基因,这些个体独特的基因就是非核心基因。
Pan-genome研究 | 研究内容 | |
基因组组装 | Pan-genome构建、多软件组装、组装结果评估 | |
基因预测与注释 | 编码基因预测;重复序列注释和转座元件分类;非编码RNA注释;假基因注释等 | |
Hi-C辅助基因组组装 | 有效数据评估;Contig聚类、排序及定向分析;挂载结果评估 | |
生物学问题解析 |
常规分析 |
核心基因与非核心基因分析; |
非核心基因区结构变异分析(SV,PAV,CNV); | ||
基因家族聚类分析; | ||
系统进化分析; | ||
高级分析 | 群体功能基因定位研究:GWAS,QTLs定位等 | |
数据库部署 |
样品寄送
公司成立于2009年,深耕基因组测序领域十多年,长久以来致力于成为精准的基因组组装专家;
拥有主流的三代测序平台(PacBio测序全平台和Nanopore测序全平台),具有丰厚的双平台组装及上万种物种基因组组装经验。在Pan-genome的构建上,具有优势。
Hi-C染色质构象捕获技术文库有效数据比例高,挂载效率高达99%,多倍体物种研究经验丰富,在泛基因组结构变异研究中可与Hi-C做整合,进一步精准鉴定基因组结构变异。
除Pan-genome的构建外,公司致力于成为专业的功能基因定位专家,在泛基因组高级分析内容群体功能基因定位中具有和大的优势。
期刊:Nature Genetics
影响因子:27.125
发表单位:华中农业大学、北京百迈客生物科技有限公司等
发表年份:2018年12月
研究背景:
棉花是世界上最大的天然纺织纤维来源,它起源于大约1-2百万年前的异源多样化事件,随后是数千年的不对称亚基因组选择。陆地棉(G. hirsutum)由于其高产而在全世界种植。G. barbadense以其卓越的纤维质量而受赞誉。为了培育产生纤维更长,更细和更强韧的陆地棉(G. hirsutum)品种,一种方法是将海岛棉(G. barbadense)的优良纤维性状引入陆地棉。基因组学启动的育种策略需要对基因组组织进行详细而有力的理解。
研究结果:
1、陆地棉和海岛棉基因组组装:
利用三代测序(PacBio RSII)+光学图谱(BioNano Genomics Irys)+Hi-C相结合的方法进行异源四倍体陆地棉和海岛棉基因组组装。组装获得陆地棉Contig L50 = 1.89 Mb,海岛棉Contig L50 = 2.15 Mb,Hi-C染色体挂载效率分别为 98.94%和97.68%(图1)。
2、陆地棉和海岛棉全基因组变异分析:
对异源四倍体陆地棉和海岛棉进行全基因组变异分析,包括SNPs和Indels变异分析,染色体结构变异及PAVs分析(图2)。预测的SNPs和InDels对陆地棉和海岛棉的基因具有很大的功能影响,进一步利鉴定了受到了正向选择(Ka/Ks >1)的基因;利用Hi-C进行染色体结构变异分析,发现有170.2 Mb的基因组序列被鉴定为G. hirsutum和G. barbadense之间的倒位。
3、Gossypium hirsutum渐渗系构建及QTLs定位:
研究中构建了渐渗系群体,旨在引入有利的变异,控制从G.barbadense到G. hirsutum等重要农艺性状的形成,如纤维质量。通过分子标记对168份渐渗系材料进行测序,并鉴定了涵盖所有26条染色体的466个基因渗入片段(图3)。进一步研究结果表明,陆地棉中无绒毛突变体的遗传变异与海岛棉中的数量性状基因座(QTL)共定位。该渐渗片段与天然纤维突变体的特征将有助于比较分析海岛棉和陆地棉之间的绒毛纤维起始机制。
研究结论:
研究中通过陆地棉(Gossypium hirsutum)和海岛棉(Gossypium barbadense)两种栽培棉种质基因组的重新组装,鉴定了大量的变异,这些变异应与其它种质的基因组分析相结合,以充分挖掘两种种质基因组间的差异。进一步通过构建渗入系,在两种代表性种质间探索研究了具有潜在优质纤维质量性状的基因组序列信息,而这在棉花育种中,可用于理想性状的培育;这些资源将极大的促进棉花功能基因组学与进化基因组学的研究,并将为棉花纤维质量的改良提供信息。