分类: 转录组测序

话接上篇,当前市场上除了火热的转录组+代谢组的联合分析来解析基因表达和表型变化的关系(多组学联合分析到底分析些什么?–转录组+代谢组篇),蛋白组的研究也是进展的如火如荼。蛋白质是生物体最终的功能执行着,其含量随着生物体的生长、环境应激反应、疾病发生发展的过程不断变化,蛋白质组学可以在大规模水平上研究一种细胞或一个生物体所表达的全部蛋白质的特征信息,由此进行差异蛋白的挖掘和功能蛋白鉴定等分析内容,获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识。

转录组和蛋白组是关系非常紧密且处于上下游的两个组学,转录组代表基因表达的中间状态,可以反映诸如转录调控、转录后调控的机理。通过转录组和蛋白组的联合分析,可以分别从RNA水平和蛋白水平对基因的表达进行衡量,获得基因表达各个步骤表达和调控的全景图,发掘常规单个组学未能发现的新结果。

分析思路

转录组的分析结果可以预测得到当前样本表达的蛋白序列,并基于此构建蛋白数据库进行蛋白预测,相比使用公共数据库进行蛋白预测可以大幅度的提升预测到的蛋白数目和准确度。通过差异基因和差异蛋白的表达趋势分析,可以获得不同相同或相反表达趋势的基因和蛋白质集,并对不同的基因集合进行功能富集分析,进一步挖掘调控生物表型的关键基因和蛋白。此外,还可以通过蛋白质的鉴定进一步验证转录组发现的可变剪接信息。当然,如果在此联合分析的基础上再结合上代谢组学的分析,打通机制与表型的研究,能够系统描绘蛋白至代谢的调控过程,挖掘关键蛋白与代谢物上下游调控通路。让整个研究内容更加丰富完整。

分析内容

转录组+蛋白组联合分析

转录组+蛋白组的联合分析的从差异基因和差异蛋白入手进行关联分析,使用KEGG的注释信息来对转录组和蛋白组进行关联,注释到同一个KEGG Functional ortholog编号(K 开头的编号)的基因和蛋白被记为一对有关联的基因和蛋白。如果使用转录组数据建库,得到的蛋白ID与转录本ID格式相同,通过人为指定的方式将基因和蛋白一一对应起来,并进行表达趋势分析、不同趋势下关联基因和蛋白的GO\KEGG功能注释及富集分析。


一、GO注释分析

对转录水平和蛋白水平都检测到的蛋白进行GO功能注释分析,将每个差异分组的差异基因和差异蛋白划分为4种不同的变化趋势(蛋白和mRNA表达趋势相同、蛋白和mRNA表达趋势相反、蛋白无变化,mRNA差异表达、mRNA无变化,蛋白差异表达),并对每种变化趋势中的基因和蛋白分别做GO功能注释,为挑选出调控表性变化的关键基因和蛋白提供了候选。

二、 差异蛋白GO富集

对于每个差异分组的4种(同上)变化趋势中的基因和蛋白分别进行GO功能显著性富集分析,作GO富集气泡图。通过GO富集分析可以得到与关联到的蛋白质背景相比,差异蛋白质中显著富集的GO功能条目,从而得出差异蛋白质与哪些生物学功能显著相关,确定差异蛋白行使的主要生物学功能。


三、 KEGG代谢通路注释

针对转录水平和蛋白水平关联的蛋白进行KEGG功能注释分析。在生物体内,不同蛋白相互协调行使其生物学行为,基于Pathway的分析有助于更进一步了解其生物学功能,通过Pathway分析能确定蛋白质参与的主要生化代谢途径和信号转导途径。


四、差异蛋白KEGG通路富集

Pathway显著性富集分析方法同GO功能富集分析,应用超几何检验,对于每个差异分组的4种变化趋势中的基因和蛋白分别进行KEGG富集,找出与所有鉴定到蛋白背景相比,在差异蛋白中显著性富集的Pathway。通过Pathway显著性富集能进一步筛选出差异蛋白最主要参与的生化代谢途径和信号转导途径。


五、九象限图

九象限图是对数据进行分类分析的常见方法。一般是利用水平和垂直分割线将图表区域分为九个象限,每个象限的数据表现有所不同,而图表主要以散点图为主。对于每一对关联的基因和蛋白,以其中蛋白的log2FC作为横坐标,基因的log2FC作为纵坐标,得到所有差异分组的蛋白和转录组表达模式九象限图,进一步把基因和蛋白的表达划分为更详细变化趋势,有助于筛选符合研究预期的基因和蛋白集合。

 

转录组+蛋白组+代谢组联合分析

转录组、蛋白组、代谢组三者的联合分析主要是对来源于相同样本的差异表达的mRNA、蛋白质、代谢物等多个数据集结合起来进行关联分析,可进一步挖掘基因、蛋白、代谢物之间的关系,以及发现生物标记,解析生物生理活动的内在机理。

一、 多组学协惯量分析

多重协惯量分析(multiple co-inertia analysis)是一种挖掘多个数据集之间共同关系的探索性数据分析方法,可将多种组学数据投影到相同的维度空间,直观的展示基因、蛋白、代谢等一种或者多种之间的联系,图中任意2个数据点与原点的连线反映了两者之间的相关性,锐角为正相关,钝角为负相关,直角则不相关。基于研究背景可提取重要的特征信息。

二、 多组学相关性热图

为进一步展示多组组学之间的相关性,对基因、蛋白、代谢物之间进行相关性分析,并绘制相关性热图,直观的展示出哪些分子间的相关性更高。

三、 多组学相关性网络图

一般认为较高的相关性可能是不同组学数据之间的关系如调控、互作等导致的,因此基于阈值筛相关性的结果可挖掘潜在的关系。并切可以通过网络图可视化多组学之间的相关性,让结果更直观。

以上就是转录组和蛋白组以及代谢组三者之间的联合分析的主要内容,通过转录组、蛋白组的联合分析从不同角度互补结合了解分子调控机制信息,而代谢组的补充则可以进一步发现与代谢物紧密相关的基因或蛋白质,实现差异表型与关键基因/蛋白的信息关联,为进一步聚焦关键分子机制提供更可靠的信息。

百迈客生物科技致力于多组学联合分析的组学研究内容,现已经有非常成熟的基因组、转录组、代谢组、蛋白组、非编码RNA之间的联合分析方案及分析流程,协助客户发表几百篇高分文章,如果您对该分析方案感兴趣,欢迎点击下方按钮与我们联系,我们将免费为您设计文章思路方案。

最近文章