分类: 基因组测序

近日,中国水产科学研究院黄海水产研究所陈四清研究员团队与北京百迈客生物科技有限公司合作完成了中国真蛸(Octopus sinensis)染色体水平基因组,相关研究成果发表在知名期刊Molecular Ecology Resources上。该研究是陈四清研究员团队继今年5月发表超高质量绿鳍马面鲀基因组后在水生生物基础研究领域取得的又一项重要研究成果。

中文题目:基于PacBio测序和Hi-C技术的中国真蛸(Octopus sinensis)染色体水平基因组组装

研究单位:中国水产科学研究院黄海水产研究所

研究背景:头足类是软体动物门中一类高度多样的海洋物种,分布于世界各地,在海洋生态系统中扮演着重要角色,也是一种重要的渔业资源。它们进化出一些类似脊椎动物的生物学结构,表现出复杂的行为特征,生活方式高度活跃,能够适应多种海洋环境,是研究趋同进化机制和环境适应性的模式物种。高质量的基因组必将有助于头足类生物学研究,但基因组大和重复序列含量高一直制约着头足类基因组学的发展。目前,头足纲仅报道了5个物种的基因组数据(长蛸、加州双斑蛸、真蛸、中国真蛸和夏威夷短尾鱿鱼),本研究是头足纲中染色体水平的基因组

中国真蛸 (Octopus sinensis,d’Orbigny, 1841)主要分布于北太平洋西部的温带浅海海域,特别是中国、韩国和日本沿海。由于外部形态极为相似,长期以来被认为与分布于大西洋和地中海海域的真蛸(Common octopus,Octopus vulgaris)为同一物种,并统称为真蛸(Octopus vulgaris)。近年来基于形态学和分子生物学研究结果表明它们属于不同物种,并将栖息于西北太平洋海域的群体命名为East Asian common octopus (Octopus sinensis),根据拉丁文名,本研究将其中文名命名为中国真蛸。中国真蛸生长快、个体大(可达2.5kg/只),生命周期短(1年),产卵量大(10-20万粒/只)等特点,具有重要的增养殖潜力。

 

研究材料

denovo成年雌性中国真蛸(Octopus sinensis)肾脏组织

Hi-C:胴部肌肉组织

转录组辅助基因预测:11个样本(肌肉、心脏、肾脏、肝胰腺、鳃、性腺、大脑、后唾液腺、吸盘、眼睛和皮肤)

 

主要结果

1. 基因组组装与评估

使用72.21X Illumina+90.08X PacBio sequel(Reads N50~14 Kb)+77.93X Hi-C进行真蛸基因组组装(表1)。调研图预估基因组大小为2.76 Gb,杂合度为0.34%,重复性为39.8%(如图1)。实际组装2.72 Gb,Contig N50为503.7kb。二代回比率为98.04%,BUSCO评估结果为80.2%。最终经过Hi-C校正后的基因组大小为2.72 Gb,其contig N50和scaffold N50分别为490 Kb和105.9 Mb,并将96.41%组装序列挂载至30条染色体上。本次组装的中国真蛸的基因组是目前已发表的头足类中染色体水平的基因组,且具有*高的连续性和较高的完整性 (表2),表明PacBio测序技术可有效地用于大而复杂的基因组的测序和组装。

 

图1 中国真蛸基因组调研图

 

图2 Hi-C热图

 

 

表1 中国真蛸基因组测序数据

 

 

表2 中国真蛸基因组与已发表的头足类基因组比较

 

2. 基因注释

本次研究在真蛸基因组中共注释出1.15 Gb(42.26%)的重复序列,主要类别为LINEs (12.38%), LARDs (17.41%)以及 TIRs (16.62%)。基于从头预测、同源蛋白预测以及RNA-seq的方法预测出31676个蛋白质编码基因。并通过NR、TrEMBL、KOG、GO和KEGG数据库的比对,成功地注释了26207个预测基因。根据GenBlastA和GeneWise分析,共鉴定出8213个假基因,总长度为18,187,167 bp,平均长度为2,214 bp,并鉴定出5245个ncRNA,其中1726个rRNA,2452个tRNA,32个miRNA,1028个snRNA,7个snoRNA。

 

3. 基因组进化

比较基因组学分析发现预测到的31676个基因中有24698个基因可被聚类到17020个基因家族。其中有741个基因家族为10个物种共有,包含有10653个同源基因。利用10个物种的238个单拷贝同源基因构建进化树,结果表明长蛸的分化时间早于中国真蛸和加州双斑蛸,而中国真蛸与加州双斑蛸关系更近,其分化时间约为13.88 Mya(图3)。

 

图3 中国真蛸与其它9个物种种系统进化分析

 

基因家族聚类分析表明中国真蛸特有的基因家族有1179个,包含5090个基因(图4),这些特有的基因家族可能对中国真蛸的特有性状具有重要作用。基因收缩和扩张分析表明中国真蛸扩张的基因家族有629个,扩张基因家族中的基因主要参与中国真蛸代谢和免疫过程。其中,C2H2锌指基因家族和钙粘蛋白基因家族仅在长蛸、加州双斑蛸和中国真蛸中发现扩张,而在夏威夷短尾鱿鱼和其它物种的基因组中没有发现。

 

图4 头足纲基因家族聚类分析

小编有言

高质量的染色体水平基因组能够为后续研究打下坚实的基础,而简单基因组的快速组装和基础分析已是现在物种资源研究的大势所趋。除了中国真蛸的成功见刊,下面小编将分享给大家几篇类似的百迈客新增成功案例,希望广大研究者能从中找寻属于你的研究方向~

Part 1

Molecular Ecology Resources专场
期刊要点:主张运用分子基因技术解决生态,进化,和行为生态保护的相关问题;较多昆虫基因组(瓢虫、草地贪夜蛾、二化螟、枯叶蛱蝶等)水生动物:(赤点石斑、绿鳍马面鲀);优质基因组+比较基因组、基因组+基因编辑/变异等。

1

影响因子:6.286

物种:油桐

合作单位:中南林业科技大学

主要研究内容:

2020年1月四川大学刘建全团队破译了中国特有的濒危物种珙桐(Davidia involucrata)基因组,相关成果发表在期刊Molecular Ecology Resources上。四川大学刘建全教授和杨勇志博士为该论文的通讯作者,陈阳和马涛教授为并列一作。该研究利用单分子实时测序SMRT和北京百迈客生物技术有限公司的Hi-C技术组装了一个高质量、染色体体水平的珙桐基因组,研究发现苞片中光合作用相关基因几乎缺失或表达减少,而抗菌、抗冷、抗水等抗逆相关基因在苞片中高度表达,突出了苞片在保护花和吸引授粉者中的重要作用。有效群体大小等研究分析了珙桐的生存机制和濒危原因。在未来气候持续变暖的背景下,研究结果为保护这独特的濒危物种提供了依据。

 

2

影响因子:6.286

物种:绿鳍马面鲀

合作单位:中国水产科学研究院黄海水产研究所

主要研究内容:

2020年5月,中国水产科学研究院黄海水产研究所陈四清研究员团队与北京百迈客生物科技有限公司合作完成了超高质量的绿鳍马面鲀基因组,相关研究成果发表在知名期刊Molecular Ecology Resources上。本次研究基于纳米孔测序技术(Nanopore)和染色体构象捕获技术(Hi-C)完成的基因组仅包含242个Contigs,Contig N50高达22.46 Mb,并将99.44%序列挂载到20条染色体上,实现了海洋鱼类基因组组装质量质的飞跃。

 

Part 2

 Horticulture Research专场
期刊要点:园艺研究的TOP期刊,拒绝:任何只有描述性的文章,包括基因组测序、组装的文章;接受:pangeomics研究,同属、同种内多物种测序,特别是对起源进化和适应性分析;多组学综合分析(基因组、转录组、蛋白组、代谢组);表观遗传;挖掘和解析和园艺与整个植物学有影响科学问题; 

1

影响因子:5.404

物种:簸箕柳

合作单位:南京林业大学

主要研究内容:

2020年2月南京林业大学尹佟明教授课题组成功破译柳树基因组,相关研究成果发表在Horticulture Research上。该研究利用百迈客生物科技有限公司的PacBio测序和Hi-C技术,获得了一个高质量染色体版本的簸箕柳参考基因组。新组装的簸箕柳基因组大小为356 Mb,Contig N50为263,908bp,并通过Hi-C,将95.29%的簸箕柳基因组序列挂载到19条染色体上。新组装的簸箕柳为木本植物研究提供了高质量的基因组资源。

 

 

2

影响因子:5.404

物种:油柿

合作单位:浙江大学、亚林所

主要研究内容:

2019年12月Horticulture Research在线发表了由浙江大学、中国林业科学研究院亚热带林业研究所等单位合作完成的二倍体油柿(2n=2x=30)基因组研究论文。研究中使用百迈客生物科技有限公司的PacBio测序组装了849.53 Mb油柿基因组序列,进一步通过Hi-C技术将其中799.71 Mb(占全基因组序列的94.14%)的序列定位到15条染色体上,并通过slaf简化测序获得的遗传图谱分析研究了其进化关系。

 

 

3

 

影响因子:5.404

物种:板蓝根(菘蓝)

合作单位:四川大学

主要研究内容:

2020年2 月1日,四川大学生命科学学院刘建全课题组与华中农业大学作物遗传改良国家重点实验室李再云课题组首次完成了菘蓝(Isatis indigotica,2n=14)染色体级别基因组图谱绘制。该研究利用Pacbio测序(140X)结合北京百迈客生物技术有限公司的Hi-C技术(284X)组装得到294Mb高质量基因组(contigN50=1.2Mb)。基于同源搜索和功能注释,确定了该物种主要化合物(如吲哚类、萜类、黄酮、木脂素等物质)的可能生物合成通路和相关的候选基因。该研究强调了基因组测序在鉴定药用植物代谢产物合成候选基因中的重要性,为今后十字花科植物比较基因组等研究提供了重要遗传信息。

 

Part 3

Gigascience 专场
期刊要点:Gigascience 由2012年创办的data类杂质,生物学故事性要求不高,旨将标准的科学出版直接与数据库相关联,存储所有研究相关数据,促进数据共享和研究的可重复性。同类型的还有Nature子刊的Scientific Data(IF:5.541)
影响因子:5.993物种:枇杷合作单位:上海市农业科学院主要研究内容:

2020年2月6日,上海市农业科学院张学英研究员团队于知名期刊Gigascience上首次发表枇杷基因组相关研究论文,该研究中基于北京百迈客生物科技有限公司的Nanopore测序和Hi-C染色体构象捕获技术,构建了高质量的枇杷基因组。文中通过与苹果、水蜜桃、梨、覆盆莓、月季和野草莓的蛋白质序列比较,探索了枇杷的全基因组复制与进化事件,并进行了染色体重排分析。该研究提供了宝贵的染色体水平基因组数据,为研究枇杷性状提供了重要的基因组数据。

百迈客基因组成功案例

 

选择百迈客的理由:

百迈客拥有专业的分析/合作团队(国际期刊Nanture Genetics合作文章高达6篇,截至2020年7月共产出50余篇基因组文章,IF 500+)。基因组及HI-C项目经验丰富,构建逾千个文库,HiC技术实验+生信双保护。分析物种类型多样,高杂合高重复、多倍体物种研究经验丰富(2倍体、3倍体、4倍体、6倍体、8倍体、10倍体等),疑难杂症不在话下!

 

最近文章