手把手教你绘制火山图

一般做完RNA的差异表达分析后,会有一堆的结果与数据。那么,怎么样让你的分析结果在paper中以更加直观形象(好看炫酷)的方式展示出来呢?

前面我们讲过热图函数pheatmap()参数讲解。下面我们介绍另外一种展示方式:火山图(Volcano Plot)。

首先,我们要注意两个重要概念:

FDR(False Discovery Rate)

在差异表达分析过程中,采用统计学方法对原有假设检验得到的p值进行校正,并最终采用校正后的p值,即为FDR。

FC(Fold Change)是两个/组样品间基因表达水平的比值,是表示差异倍数的变量。

一般差异表达分析中会同时控制这两个参数来筛选显著差异表达基因,如取FDR<0.05和FC≧2。

火山图可以直观地展现所有基因的FDR与Fold Change之间的关系,以便快速查看基因在两组样品间表达水平的差异程度和其统计学显著性。火山图的本质其实就是散点图。

横坐标表示某一个基因在两样品中表达水平差异倍数的对数值,即log2(FC);横坐标绝对值越大,说明基因表达量在两样品间的倍数差异越大。纵坐标表示FDR的负对数值,即-log10(FDR)。纵坐标值越大,表明差异表达越显著,筛选得到的差异表达基因越可靠。

下面,小编就手把手教你如何绘制火山图啦。

第1步  数据准备

差异表达分析结果数据示例:第一列为基因名称,第二列为差异表达分析算法得到的p值,第三列为矫正后的p值,即FDR,第四列为log2FC值。绘制火山图只需要最后两列就行。

数据准备

gene_symbol PValue FDR log2FC
RAB22A 0.731093877  0.915536119  -0.043559185
DDX20 0.455372338  0.779014647  -0.099300804
CILP2 0.415756716  0.749566482 1.420386794
项目 #4 0.003274032  0.056770217 6.182603532
RP11-618P17.4 0.351633414  0.709160705 -0.108742132

第2步  R代码画图

 

最后绘制出来的火山图如下,是不是比干巴巴地在文章里面贴一个差异表达分析结果的表格好看多了?

注:

一个点表示一个基因, 横坐标表示某一个基因在两样品中表达水平差异倍数的对数值;纵坐标表示FDR的负对数值。横坐标绝对值越大,说明基因在两样品间的表达水平倍数差异越大;纵坐标值越大,表明差异越显著,筛选得到的差异表达基因越可靠。图中绿色的点代表表达下调基因, 红色的点代表表达上调基因, 黑色代表非差异表达基因。

 

 

 
最近文章