分类: 质谱检测, 转录组测序

随着测序行业的飞速发展,探究影响表型变化的因素的产品层出不穷,不管是从DNA水平还是RNA水平,还是现在火热的代谢物水平,都有各自的组学研究系统,这些组学之间的关系就像一条从上到下的河流,DNA水平的基因组学处于最上游,决定了河流的开始和基本属性,好比不同的物种都有特定的基因序列特征,并且是相对保守的。但是河流的上游无法决定河流下游的去向,就像基因不能完全决定最后的表型。因为基因后面还有表观遗传修饰,还有转录,翻译,环境的影响,并且这些改变和影响最终都会体现在代谢物的差异上。所以我们可以看出,单一组学的数据难以系统全面地解析复杂生理过程的调控机制,多组学联合分析可以共同探究生物体内潜在的调控网络机制,为生物体作用机制提供了更多证据。当然,除了基因发生突变,会直接影响代谢物水平和表型,环境的影响也会体现在表型和代谢物水平上,比如根际微生物和植物的互作作用,肠道微生物对于宿主的影响等等。

中心法则是遗传的基础,在中心法则中,RNA处于重要的中央枢纽地位,转录组作为生信科研中的“万金油”,最大的特点就是“短平快”,是功能基因的研究利器,是利用率最高,最成熟的测序手段,在多组学联合中扮演中重要的角色。代谢组是表型的直接体现者,“代谢组+ ”研究模式已经在多个领域广泛使用,成为深入研究科学问题,系统阐释作用机制的利器。以下就是常见的基于这两个组学的联合分析策略。

今天主要先从转录组+代谢组方向进行联合分析内容的说明。

mRNA+代谢组

转录组测序可以得到大量差异基因、众多调控网络。难以确定关键途径,也无法鉴定控制关键途径的结构,而代谢物是生命活动最终的体现者,表型性状的微小变化在代谢水平会呈指数放大,可以利用代谢组来反映表型的状态变化,但是单独代谢组检测,无法解释影响表型的基因机理。转录本水平的基因变化是否真的是决定表型变化的关键基因?这个问题需要通过转录组和代谢组的联合分析进行回答。
转录组+代谢组的多组学分析,可以同时实现从“因”和“果”两个层面来探究生物学问题,相互间进行验证,从海量的数据中筛选出关键基因、代谢物及代谢通路,深度解析生物系统的宏观发育过程,解释生物过程的复杂性和整体性,提高文章的水平。

样本准备

转录组和代谢组的联合分析通常为一份材料同时送测两个组学,这样对于样本量准备会有更高的要求,普通转录组推荐准备有三个生物学重复,而代谢组的要求更高,需推荐单样本有六个生物学重复,生物学重复不仅能够消除组内误差、作为实验设计质控点用于判断实验设计过程是否异常、检测离群样本有效规避实验失败的风险,更重要的是可以增强结果的可靠性,严谨的实验更容易发表高分文章。(特别对于临床研究的项目,由于研究的对象有复杂的遗传背景,生活方式,个体年龄性别体质等等,导致难以实现背景一致性的样本,所以更要通过生物学重复的设置来降低样本间的背景差异造成的影响。)

 

分析思路

转录组通过标准分析流程得到差异表达基因功能富集等分析结果,代谢组根据不同的产品类型,可以鉴定得到样本中表达的代谢物,并分析得到差异代谢物及代谢通路富集结果。将差异基因和差异代谢物在KEGG上共富集的基因和代谢物进行联合分析,并计算差异基因和差异代谢物的相关性,构建相关性网络,可以找出引起代谢物发生变化的关键作用基因,确定关键的调控通路。

分析内容

代谢与转录组联合分析是基于两个组学各自的标准分析结果,将差异代谢物和差异基因在代谢通路上的注释结果进行关联分析,可以在代谢通路上更好地解释转录调控机制。常规的联合分析内容主要包括代谢组和转录组KEGG通路分析、KEGG共富集分析、相关性分析、差异基因和差异代谢物趋势分析、典型相关性分析、限制性对应分析等内容。

一、代谢组和转录组KEGG通路分析

差异代谢物分析结果结合转录组差异基因分析结果,将相同分组的差异基因及差异代谢物同时映射到KEGG通路图上,用绿色和红色标注基因或代谢物表达量显著下调或上调的节点,蓝色标注既有上调又有下调的基因,更好的了解基因与代谢物之间的关系。

二、KEGG共富集分析

进行KEGG注释时,差异代谢物与差异基因同时注释的通路往往有很多。这种情况下,挑选基因和代谢的通路富集系数pvalue<0.05优先进行分析,这样可以节约筛选数据的时间,快速找到与研究目的相关的通路进行后续分析。

三、基因与代谢物相关性分析

将不同差异分组基于皮尔逊相关性(pearson)方法计算所有基因和代谢物之间的相关性,然后按照相关性系数(Correlation Coefficient,CC)和相关性的pvalue筛选表达相关性较高的基因和代谢物。并利用九象限图对于筛选后的基因和代谢物的表达趋势进行分析,例如基因和代谢物表达趋势一致或相反,表明基因可能是正向或者负向调控代谢物,或者基因/代谢物表达发生变化,但是对应的代谢物/基因表达不变,则说明还有其他的调控机制参与到整个代谢通路中。


四、差异基因和差异代谢物趋势分析

将各个分组对差异代谢物和差异基因分别用Kmeans进行分类,然后按分类进行绘图,可找到变化趋势一致代谢物和基因,这些趋势一致代谢物和基因之间可能存在一定的关系,为研究提供了一定的方向。

五、相关性网络图

按通路选取经过相关性筛选的差异基因和差异代谢物绘制网络图,通过网络图来可直观的表示代谢物和基因之间的关系。

六、典型相关分析

典型相关分析(canonical correlation analysis, CCA),是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。对相关性网络图中的差异基因及差异代谢物进行典型相关分析,图中以十字区分出四个区域,在同一个区域内,距原点越远关联性越高,在同一个象限内距离较近的代谢物和基因之间相关联的程度高,基于此结果可进一步挖掘和代谢物最相关的基因。

七、 限制性对应分析

对应分析(Correspondence Analysis)也称关联分析,是一种多元统计分析技术,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。对通路中的差异代谢物和差异基因进行限制性对应分析可直观展示他们之间的关联关系。

以上就是转录组和代谢组联合分析的主要内容,由于生物过程具有复杂性和整体性,多种物质共同影响生命系统的表型和性状,例如环境、基因、mRNA、调控因子、蛋白、代谢等,这些组学之间,既相互独立,又互相影响,既有很大的差别,又有相似之处。多种多样的组学联合分析将不同层面之间信息进行整合,从不同的组学角度共同探究生物体内潜在的调控网络机制,深层次理解各个分子之间的调控及因果关系,从而更深入的认识生物进程和疾病过程中复杂性状的分子机理和遗传基础,后续我们还将推出其他常见的组学联合分析内容的介绍,敬请期待。

百迈客生物科技致力于多组学联合分析的组学研究内容,现已经有非常成熟的基因组、转录组、代谢组、蛋白组、非编码RNA之间的联合分析方案及分析流程,协助客户发表几百篇高分文章,现在您可以点击下方按钮联系我们,我们将免费为您设计文章研究思路方案。

最近文章